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المشكلة الجوهرية في تنظيم المعلومات واسترجاعها 


عملية تنظيم المعلومات واسترجاعها 0 00 1 1 1 1 21111111 
أوجه القصور في تنظيم المعلومات واسترجاعها ... 
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وقققة م وم وومثمي ةونع مثيه 


000 


0000000 


00000 


0000 


0001010011 


ا ا 0 0000000000 


و قوووف وو ووم م وو ء ةو وم يوون 


وقافة ووم يو ءايمع مثو موي وه 


اندماج طريقتي التقسيم الفئوي وطخ طاح اط الما 014 نايا مود لا ل أ 
التلشخيص 000000 0000 


الطرق الأخرى لتنظيم المعلومات 00000 
الاستشهادات المرجعية 0 93##ظ2« 


0000000000000 


وقفعوقة ممعم ثليه 


ولثم ءثمثمو مم مه 


ملخص الموقع الثري 0 
قضية القدرة التمثيلية لم لان 


و ولثم ثم روث ووه 


فور وم نووم 6 موه 


0000000000 


مراجعة للطرق الرئيسة لتنظيم المعلومات ا 


المراجع 0000 


الفصل الثالث: تنظيم المعلومات »: الموضوعات ذات الصلة 


ما وراء البيانات؟ مففعة فممعة ممم وفوف فلمو ومو فق ففاء وقفافة لمعه 


ماذا يقصد ب وراء البيانات؟ ا 0 00000 


خصاض الغلومات الرقمة غل الإنرنت ا 


لقعم وة مم ثوق وومةه 


وعلوممو ث6 6 مه 


تنظيم معلومات النصوص الكاملة 1237000 
صعوبات تنظيم النصوص الكاملة وح ا ا 
تنظيم معلومات الوسائط المتعددة ا 0 
أنواع معلومات الوسائط المتعددة ا اخ و 


طريقتان رئيستان للتنظيم د00 
التحديات في تنظيم الوسائط المتعددة 00000 


اللغة الطبيعية في مقابل اللغة المقيدة از[ [ز[ز[ [ [ز[ 1 2710 
الحقب المختلفة للغات تنظيم المعلومات واسترجاعها 2006 
لماذا اللغة الطبيعية أم لماذا اللغة المقيدة؟ 071«( 


وفوموةمةعثو ميم 


مثثعءمثمثممهة 


قضية النظم سل سس ا اساسا ال ا 


و فقول وثولوثوة 


ثثث موقم ررم 


وم .رم مة يوق 


البحث في مراصد بيانات متعددة الظ ا الج ا 
اختيار تقنيات الاسترجاع ا ا ا 0 
وظائف تقنيات الاسترجاع وسو مج م ف و كس رت ل لمق قي 
ذأذاما مستي ومو مف ايخ ووسسكتس ولت 000 
تقنيات الاسترجاع والارتفاع بمستوى التحقيق 11111 
تقنيات الاسترجاع والارتفاع بمستوى الاستدعاء ه15 
التعبير عن الاستفسارات 00 
الخطوات العامة 1 
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استخدام المعاملات البولينية 2*0 


استععال تقنيات الاسترجاع الأخرى 


الأسلوب الآلي مجه امواه الما وا 


/ 


تكامل البحث والتصفح في الاسترجاع 575 
المقارنة بين بجي الاسترجاع لوم جع و ا ل ا ا ار ا 
الخاجة إلى المعلومات ع ا م ا 
الكفاءة واحتتاللات التحسن 000 
العبء المعرفي ا 
الصدفة لتقف مع دو ون ور و ول ام ونع لوطه ل كو و 110 1 وا 
اللنهوة 00 
النهج المتكامل دوق جو أدبن وافاوه اعساو سا رواب امسو م ا 
المراجع نحاق لا لمعا انوا الوم ا ا 
الفصل السابع: نماذج استرجاع المعلومات و ا 
أساس جميع نماذج استرجاع المعلومات: المضاهاة 2101 
مضاهاة المصطلحات 00 0 0 10/0ظ15 
مضاهاة مقاييس التشابه 00 
أنموذج المنطق البوليني ا 00 
مظاهر قوة أنموذج المنطق البوليني 0«ط5 
أوجه قصور أنموذج المنطق البوليني من كرو خسوا و اس ومسو 
أنموذج الفضاء المتجهي و ار ا 
مظاهر قوة أنموذج الفضاء المتجهي فج ا اواو و ا ا ا ا 
أوجه قصور أنموذج الفضاءً المتجهي ل و ات ا 1 


أنموذج الاحتالات مام سج م و حو ود 1 
مظاهر قوة الأنموذج الاحتتالي ا رماسو اا 
مظاهر قصور أنموذج الاحتماللات 111111100 
امتدادات النماذج الرئيسة لاسترجاع المعلومات ل 
أنموذج المنطق البوليني الممتد ا 000 
أنموذج الفئات المشوشة 000000 
نهاذج استر جاع المعلومات: نظرة إضافية مسق قرا اود ا مل 
مراجعة للناذج الرئيسة لاسترجاع المعلومات 00 0 2*7 
نماذج استرجاع المعلومات في مقابل تقنيات الاسترجاع 0 
في الطريق إلى نظم استرجاع المعلومات متعددة النماذج 0ك 


الفصل الثامن: نظم استرجاع المعلومات المع خا فدات ومس 
نظم الخط المباشر: النظم الرائدة لاسترجاع المعلومات 0000 
خصائص نظم الخط المباشر لاسترجاع المعلومات ا 
نظم الخط المباشر واسترجاع المعلومات ز ز[ ز ز ز ز 0000 
نظم الأسطوانات المكتنزة: وسط مختلف لنظم استرجاع المعلومات 0 
خصائص نظم الأسطوانات المكتنزة ا لظ 
نظم الأسطوانات المكتنزة واسترجاع المعلومات 00 شهشظ2ظ1 
الفهارس المتاحة للجمهور على الخط المباشر: الفهارس الإلكترونية 
للمكتبات كنظم لاسترجاع المعلومات 1 ا ار املد امام وام وي 
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خصائص الفهارس المتاحة للجمهور على انط المياشر وفثفة مام ءارم ةفر مم مقن 


الفهارس المتاحة للجمهور على الخط المباشر واسترجاع المعلومات 


نظم استرجاع الإنترنت: أحدث أعضاء أسرة نظم استرجاع المعلومات .. 


نظم استرجاع الإنترنت واسترجاع المعلومات ا 1 
نظم استرجاع المعلومات: بعض الاتجاهات 50 


اندماج نظم استرجاع المعلومات 0 


الجيل الثاني للعنكبوتية ونظم استرجاع المعلومات 
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فوقوم مم ووو مث م نيوو و يورو مو 


ا 00000 


252 
286 
237 
259 
289 
251 
204 
256 
2526 
259 
300 
306 
311 
313 
314 
318 
3220 
321 
323 


الفصل التاسع: استرجاع المعلومات الفريدة في محتواها أو في شكلها.... 

المعلومات متعلدة اللغات .................. 9 غ152 
استرجاع المعلومات متعددة اللغات في الماضي 211701111111006 
استرجاع المعلومات متعددة اللغات على الإنترنت 00 
البحث حول استرجاع المعلومات متعددة اللغات 0 
المعلومات متعددة الوسائط دب ا 00 
استرجاع الصور الثابتة ب1-1د1ج0010101 0 0000 


استرجاع الصور الثابتة القائم على الوصف م فلع وو ا 1 


استر جاع الصور المتحركة وففميةة فيفر ونمو مفو قفو وهو وو مو ونم مم مم ممم ممم لقم 
استرجاع الوسائط المتعددة على الإنترنت دادع 0ه وام ارا علدا ولا 1 1110 


معلومات النصوص الفائقة والوسائط الفائقة عه همه اها عق واه مه هه 666 66 6ق * 


المستفيدون واحتياجاتهم المعلوماتية 2211111 


الأنموذج المعرفي والنماذج التي تركز على المستفيد 1 21 


تفاعل المستفيد مع النظام 0000000 


أساليب تفاعل المستفيد مع النظام 1 0101 


معو لوثم ممه 


لغة إصدار الأوامر 8 0000 


الاختيار من قائمة الخيارات قاع متها وها لقا قاع ولق 21406 و61 44 8 هفلو و عترو اق قل ااال 6زم فروف لالد 


الأسلوب التصويري للتفاعل 0 


النماذج الأخرى لتفاعل المستفيد مع النظام 0 
الأسلوب الهجين للتفاعل 00 3*7 
الأبعاد الأخرى لتفاعل المستفيد مع النظام ا 


00000000 


0000000000 


و نوم و مر ثلث وقوه 


تقييم تفاعل المستفيد مع النظام 2111110111100ظ12ظ22 


الوقت اللازم لتعلم المستفيد مهام استرجاع محددة 1 


الفصل الحادي عشر: تقييم تنظيم المعلومات واسترجاعها 
مقاييس تقييم تنظيم المعلومات واسترجاعها ا 


00 


وهو قوو ووه .0 


فققاثة وفووة مث ء ميو 


مقاييس تقييم تنظيم المعلومات 00 


تحديد جميع الوثائق الصا حة في نظام ما 0101717108 


انتقادات الاستدعاء والتحقيق اللأخرى 0 


الأشكال المختلفة لمقيامي الاستدعاء والتحقيق 200 
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0000000 


000000000 


وقففر م وموم وو مم ثقهة 


ولمقوة وم مو ونم يوم 


المقاييس الأحادية لتقييم استرجاع المعلومات ا 


مقايبس التقييم الأخرى لاسترجاع المعلومات 2525 
معايير تقييم نظم استرجاع المعلومات 2ك 


معايير تقييم نظم الخط المباشر ا 


معايير تقييم الفهارس المتاحة على الخط المباشر 21*06ظ 
معايير تقيبم نظم استرجاع الإنترنت ا 
معايير تقييم نظم الاسترجاع متعددة الوسائط 5 
القابلية للإفادة معيارا للتقييم 00 


مشروعات التقييم الكبرى لتنظيم المعلومات واسترجاعها 


0000 


«ثمثممم ممم م وو و6 وو 


000000001 


قوف ة وو وةة .ةم ث ةق ونون 


ووقعةع يمرم و و6 موه 


فقف من ةيوقم ممم موه 


فوقو وموم 6و6 م 


00000000000 1 


0000000 


سلسلة مؤتمرات استرجاع النصوص 00 1 0 001011 


تصميم سلسلة مؤتمرات استرجاع النصوص 2 
الفرق المشاركة 111 


نتائج مؤتمرات استرجاع النصوص ا 
مشكلات مؤتمرات استرجاع النصوص ا 
أهمية مؤتمرات استرجاع النصوص ا 
كلمة أخيرة حول تقييم تنظيم المعلومات واسترجاعها ا 


الفصل الثاني عشر: الذكاء الاصطناعي في تنظيم المعلومات واسترجاعها. 
نظرة عامة على بحوث الذكاء الاصطناعي 0 170101 ظك5757 
معالحة اللغة الطبيعية 0 


الرد على الاستفسارات 000011 
عملية الرد على الاستفسارات 0000 5ك( 
تطبيقات الرد على الاستفسارات [ [ [ [ [ [ [ 1111 


البحث باللغة الطبيعية 000 
العنكبوتية الدلالية 121 
الحندسة المعمارية للعنكبوتية الدلالية 1515*#7000 
العنكبوتية الدلالية وتنظيم المعلومات واسترجاعها 00007 
التنظيم والاسترجاع الدلالي للمعلومات على العنكبوتية 700 
الوكلاء الأذكياء ا ا ا 
التحديات التي تواجهها العنكبوتية الدلالية كأحد تطبيقات الذكاء 
الاصطناعي مابس تاوصا م ور 
الذكاء الاصطناعي وتنظيم المعلومات واسترجاعها 0000 
المراجع ا و 
ثبت المصطلحات ناوا ان ع أ جدق حي ود 0 
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(الإقراء 


إلى الدارسين والممارسين والباحثين فى علم 
المعلومات, الحريصين على دعم مقومات 
استثمار المعلومات, لتحقيق الأهداف السامية 
للمجتمعات؛ أهدى جهدى ف هذا الكتاب 
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كلمة المترجم 


الحمد لله رب العالمين» والصلاة والسلام على خاتم الأنبياء والمرسلين» سيدنا 
محمد وعلى آله وصحبه ومن والاه إلى يوم الدين ... 

فهذا هو الكتاب الرابع الذي أتحمل على نحو ما مسئولية ترجمته إلى العربية» في 
مجال استرجاع المعلومات؛ فقد كانت البداية بكتاب ألن كنت ]18 «ع1آى» الذي 
صدرت طبعته الأولى في بداية ستينيات القرن العشرينء بعنوان 8ه 0016ط)اع7 
15 [أولاعأماء5 105522109د1 لعتأسقطء»22. وتر حجنا تلك الطبعة إلى 
العربية» وبينم) كانت الترجمة العربية تتتظر دورها في النشرء صدرت الطبعة الثانية من 
الكتاب نفسه؛ في مطلع سبعينيات القرن نفسه. بعنوان و5لأولالهقسة ده تأقدرمكهآ1 
ليت ريت 40 فضربنا صفحا عن نشر ترجمة الطبعة الأولى؛ وشرعنافي ترحمة 
الطبعة الثانية» التي صدرت عام 1137م." ثم شرفت في مطلع ثإنينيات القرن 
العشرين بنشر الترجمة العربية للطبعة الثانية من كتاب فردرك ولفرد لاتكستر 
#عاكقعه هآ 7111610 “نظم استرجاع المعلومات.... "وني عام ١9191‏ نشرت 
ترجمة الطبعة الثالثة من ذلك الكتاب". 


)١(‏ كنته ألن. ثورةالمعلومات؛ استخدام الحاسبات الإلكترونية في اختزان المعلومات 
واسترجاعهاء ترجمة: حشمت قاسم وشوقي سالم؛ مراجعة: أحمد بدر. الكويت. وكالة 
المطبوعات» .1١91/7”‏ 

)١(‏ لانكسترء فردرك ولفرد. نظم استرجاع المعلومات» ترجمة: حشمت قاسم. القاهرة» مكتبة 
غريب. .١98١‏ 

2 لانكستر فردرك ولفرد وآمي وونر. نظم استرجاع المعلومات. ط”؛ ترحمة: حشمت قاسم. 
الرياض. مكتبة الملك فهد الوطنية: .١9891/‏ 
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وإذا كان كتاب ألن كنت قد قدم صورة لمجال استرجاع المعلومات حتى نهاية 
العقد السابع من القرن العشرينء الذي شهد البدايات المبكرة لاستخدام الحاسبات في 
اختزان المعلومات واسترجاعهاء فقد رصدت الطبعة الثانية من كتاب لانكستر 
تطورات المجال حتى منتصف العقد الثامن من القرن نفسه. وواصلت الطبعة الثالفة 
من ذلك الكتاب الاهتمام بها شهده المجال من تطورات. حتى مطلع العقد الأخير من 
القرن العشرين» قبل أن تفجر ثورة الإنترنت شحنة التطورات المتلاحقة؛ التي لا نزال 
نخوض غمارها حتى اليوم فحسبء وإنم| نستشرف أيضا آفاق مستقبلها وتداعياتها 
المرتقبة. ولقد كنت أترقب صدور الطبعة الرابعة من كتاب لانكستر الذي طالما مبرنا 
بأدائه العلمي واللغوي المتميز. إلا أنه طال الانتظار ولم تظهر الطبعة الرابعة من ذلك 
الكتاب. وأرى في الكتاب الذي نقدم لترجمته العربية اليوم؛, ضربا من التعويض 
الجرئي على الأقل. 

فقد صدرت الطبعة الأولى من كتاب هتنج تشو ناط0) 18 في مطلع 
القرن الحادي والعشرين (عام .»323٠١١‏ وترجمت إلى اللغة الكورية عام 2٠٠١8‏ 
ونشرت في الهند عام .7٠04‏ ثم صدرت الطبعة الثانية من هذا الكتاب عام 25١٠١‏ 
متضمنة الكثير من الإضافات والتعديلات التي تتناول ما استجد من تطورات» 
وتستثمر رسائل التلقيم المرتد التي تضمتتها آراء النقاد» فيما حظيت به الطبعة 
الأولى من مراجعات. وقد ورد بيان الإضافات والتعديلات تفصيلا في تصدير هذه 


الطبعة الثانية. 
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ولدت مؤلفة هذا الكتاب عام !441١؛‏ وحصلت على الليسانس في علم 
المكتبات» من جامعة بكين 17215655143 ع2أكاء2 في الصين. وعلى الماجستير في علم 
المكتبات والمعلومات» من جامعة ماجل 2176755113ل] 3402111 في كنداء وعلى 
الدكتوراه في دراسات المعلومات من جامعة دركزل إغأومع نهنا اعدءم2 في 
الولايات المتحدة الأمريكية. ثم عملت تشو أستاذًا مساعداء لمدة عام واحد في جامعة 
سانت جون 2197615117[ 70825 .)5. وانضمت إلى هيئة التدريس فى جامعة لونج 
أيلاند 151884 8همركء بالولايات المتحدة الأمريكية؛ في سبتمير عام 1995, حيث 
تعمل الآن أستاذا بمعهد بالمر لعلم المكتبات والمعلومات 06 اممطء5 «عصراوط 
ععصع 5 12022155 لصه ورقططار1. وقد ألفت تشو خمسة كتب بالصينية» 
حول استرجاع المعلومات». وما يتصل به من موضوعات. وتشمل اهتمامات تشو في 
البحث والتدريسء استخدام تقنيات المعلومات في المكتبات وتنظيم المعلومات 
واسترجاعهاء ومناهج البحث. والاتصال العلميء والقياسات الوراقية 
115) 12 وفياسات اللنشاط العلمي ف ل وتتراوح 
موضوعات بحوث تشو ما بين المكتبات الرقمية» والكتب والدوريات الإلكترونية؛ 
ومحركات البحث في العنكبوتية» وتطبيقات الجيل الثاني من العنكبوتية 
0.2 لطاع الا. 

ومنذ انضمامها إلى هيئة التدريس فى جامعة لونج أيلاند؛ تقوم تشو بتدريس مقرر 
واحد في المرحلة الجامعية الأولى» وثانية مقررات في مستوى الماجستيرء كما أدارت حمس 
قاعات للبحث للدكتوراه. وتشمل خدمات تشوفي لونج أيلاند المستويات 
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المحلية والوطنية والدولية. وتشارك تشو في أعمال ثاني لجان على مستوى الجامعة» كما 
تشارك في تحكيم ما يقدم للنشر في ست دوريات متخصصة في علم المعلومات؛ فضلا 
عما يصدر عن دارين للنشر من كتب. كما أنها عضو في مجالس تحرير عدد من 
الدوريات المتخصصة في علم المعلومات. وفضلا عن كثافة الاستشهاد المرجعي 
بأعمالهاء كثيرا ما تتلقى تشو طلبات الحصول على مستلات من مقالاتهاء من أناس في 
مختلف أنحاء العالم. 


هذا عن المؤلفة» فاذا عن الكتاب؟ 


يتكون هذا الكتاب من اثني عشر فصلاء يأتي أوها بمثابة تمهيد, يلقي نظرة 
شاملة على التطور التاريخي لتنظيم المعلومات واسترجاعهاء ويعرف بعدد من رواد 
لمجال ويناقش المفاهيم الأساسء ويحلل مكونات المجال» ويعرض لأبرز مشكلاته. 
ويعالج الفصلان الثاني والثالث تنظيم المعلومات» موزعا على قسمين؛ يتناول أولهم]| 
(الفصل الثاني) الطرق الرئيسة للتنظيم؛ من التكشيف والتصنيف والتلخيصء بينا 
يتناول الثاني (الفصل الثالث) ما يتصل بالتنظيم من موضوعاتء تبدأ بما وراء 
البيانات» وخصائص النصوص الكاملة ومشكلاتهاء وتنظيم معلومات الوسائط 
المتعددة. وتستأثر اللغة» لما هما من دور رئيس في تنظيم المعلومات واسترجاعهاء 
بالفصل الرابع» الذي يتناول اللغة الطبيعية» واللغات المقيدة» على نحو مقارن» يبرز ما 
لكل من الشكلين وما عليه؛ مع الاهتمام بخصائص لغة تنظيم المعلومات واسترجاعها 
في العصر الرقمي. وتتناول الفصول من الخامس حتى التاسع أساليب الاسترجاعء 
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وصياغة الاستفسارات. ويتناول الفصل السادس طرق الاستر جاع كالبحث أو 
التنقيب والتصفحء والتكامل بين البحث والتصفح في الاسترجاع. ويناقش الفصل 
السابع نماذج استرجاع المعلومات» بدءا بالمضاهاة كأساسء ثم الجبر البوليني؛ 
وأنموذج الفضاء المتجهيء وأنمو ذج الاحتمالات» وامتدادات الناذج الرئيسة 
لاسترجاع المعلومات, واتجاهاتها الحديئة. ويتناول الفصل الشامن نظم استرجاع 
المعلومات في تسلسلها التاريخيء بدءا بنظم الخط المباشر» ونظم الأسطوانات المكتنزة» 
ونظم الفهارس المتاحة على الخط المباشر ونظم استرجاع الإنترنت» ويختتم 
بالاتجاهات الحديثة في نظم استرجاع المعلومات. ويتناول الفصل التاسع استرجاع 
المعلومات المتفردة في محتواها أو في شكلهاء كالمعلومات متعددة اللغات, والمعلومات 
متعددة الوسائط. ومعلومات النصوص الفائقة» ومعلومات الوسائط الفائقة. 

ويحظى المستفيد من المعلومات بالاهتمام في الفصل العاشرء الذي يتناول 
المستفيدين واحتياجاتهم المعلوماتية» والأنموذج المعرفي» وغيره من النماذج التي تركز 
على المستفيد؛ والتفاعل بين المستفيد والنظامء ويختتم بإلقاء نظرة على المستفيد 
واسترجاع المعلومات في العصر الرقمي. وكا في أي نشاطء فإن للتقبيم أهمية لا تتكر 
في تنظيم المعلومات واسترجاعها. ويتناول الفصل الحادي عشر التقييم» من حيث 
مقاييسه» ومعايير تقييم نظم استرجاع المعلومات بكل فئاتهباء فضلا عن القابلية 
للاستخدام بوصفها معياراً للتقييم. ويفسح هذا الفصل المجال لمعالجة أكبر مشروعين 
للتقييم في تنظيم المعلومات واسترجاعها؛ وهما تجارب كرانفيلد» وسلسلة مؤتمرات 


استرجاع النصوص. 
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ويعالج الفصل الثاني عشر الأخير الذكاء الاصطناعي في تنظيم المعلومات 
واسترجاعهاء ويبدأ بإلقاء نظرة على بحوث الذكاء الاصطناعيء ومعالجة اللغة 
الطبيعية» لما لها من دور محوري في تنظيم المعلومات واسترجاعهاء ثم الجوانب 
التطبيقية لمعالجة اللغة الطبيعية» ثم العنكبوتية الدلالية من حيث هندستها المعمارية» 
وتطبيقاتها في استرجاع المعلومات؛ والتحديات التي تواجهها بوصفها أحد تطبيقات 
الذكاء الاصطناعي. ويختتم هذا الفصل بدور الذكاء الاصطناعي في تنظيم المعلومات 
واسترجاعها. 

وفضلا عن الثراء المعلوماتي» تتسم المعالجة في هذا الكتاب بالتسلسل المنطقي 
القائم على التدرج من العام إلى الخاصء ومراعاة البعد التاريخي. وعلى هذا النحو 
يكتسب هذا الكتاب الطابع الدراسي؛ الذي يؤهله للارتباط بمقررات تنظيم 
المعلومات واسترجاعها في البيئة الرقمية. 

وقد حرصت المؤلفة على ربط محتوى الكتاب برصيد الإنتاج الفكري في مجال 
تخصصه. بقوائم المراجع الملحقة بكل فصل. وقد بلغ عدد الأعمال المستشهد بها في 
الفصل الأول 54 عملاء والأعمال المستشهد بها في الفصل الثاني "”١‏ عملاء وني 
الفصل الثالث ٠١‏ عملاء وفي الفصل الرابع 6 ؟ عملاء وني الفصل الخامس سبعة 
عشر عملاء وفي الفصل السادس ثانية عشر عملاء وفي الفصل السابع ١"‏ عملاء وفي 
الفصل الثامن 44 عملاء وفي الفصل التاسع 08 عملاء وفي الفصل العاشر 7ه 
عملاء وني الفصل الحادي عشر 44 عملاء وفي الفصل الثاني عشر 45 عملا. 
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والإنجليزية هي اللغة الغالبة على الأعمال المستشهد بها. وتتراوح هذه الأعمال 
بين مقالات الدورياتء وتقارير اليبحوث» وبحوث المؤتمرات» ووثائتق المواصفات 
المعيارية» والكتب وفصول الكتب. وتلتزم تشو بأسلوب الاستشهاد المرجعي المتبع في 
المراجعات العلمية؛ إذ تورد بيانات الأعمال المستشهد بها في نباية كل فصلء مرتبة 
هجائيا بأسماء المؤلفين متبوعة بتواريخ النشر. ويتم الربط بين قوائم المراجع والنص 
بتسجيل هذين العنصرين بين قوسين في المتن. 

ولقد ترددت طويلا أمام مصطلح «هفأهامء»مع1 في عنوان أصل هذا 
الكتاب؛ فلهذا المصطلح ثلاثة مقابلات محتملة في العربية؛ أولهاء وربها كان أبسطها 
”تمثيل'” وثانيها '“التعبير عن“ وثالثها '”التنظيم“. ويمكن لمصطلح ”التمثيل” أن 
.يبدو غامضا في هذا السياق. أما '”التعبير عن'' فيمكن أن يكون مرادفا للتمثيلء بينا 
تشعبت موضوعات هذا الكتاب على نحو يتجاوز المجال الدلالي لكل من " التمثيل” 
و”التعبير عن“» ويربطنا بالمجال الدلالي لمصطلح ”التنظيم”» ذلك المصطلح الذي 
ارتبط بالاسترجاع ارتباطا وثيقا. وقد فضلنا هذا المصطلح الأخير, الشامل الذي 
يغطي الجوانب اللغوية والتقنية والتنظيمية والمسلكية للتعامل مع المعلومات. يضاف 
إلى ذلك أن استعمال ”استرجاع المعلومات'“ عنواناً للكتاب في هذا المجال يعد كافيا 
في حد ذاته» لأنه دائم) ما يكون هناك وراء الاسترجاع الفعال تنظيم واختزان. 

ومن الطبيعي لكتاب يعالج أحدث تطورات تنظم المعلومات واسترجاعهاء أن 
يتضمن عددا كبيرا من المصطلحات التي تدل على ما استجد من مفاهيم, أو تمشل 
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وسيمات جديدة لمفاهيم قديمة. وقد بذلت قصارى جهدي في اختيار مقابلات عربية 
لهذه المصطلحات. وما هذه المقابلات العربية إلا اجتهادات؛ يمكن أن تصيب أو 
تخطئ. ونحمد الله تعالى أن هدانا للصواب؛ ونعتذر عن أي خطألم نقصده. وقد 
حرصت على تسجيل المصطلحات التي وردت في ثنايا الكتابء ومقابلاتها العربية 
المقترحة» في ثبت ورد في نباية هذا الكتاب. 
وإذ أقدم ناتج جهدي في ترجمة هذا الكتابء أرجو أن أكون قد وفقت في نقل 
رسالة المؤلفة كاملة غير منقوصة؛ فقد حرصت قدر طاقتي على مراعاة الأمانة» 
بالتوفيق قدر الإمكان بين نظامين لغويين» لكل منههما بيئته الاجتماعية والثقافية. 
وإمكاناته وخصائصه النحوية والدلالية. وبصدور هذا الكتاب تكتمل بحوا الله 
تعالى» رباعية ترصد تطورات مجال استرجاع المعلومات على مدى حوالي نصف قرن. 
وأسأل الله تعالى أن يكون جهدي هذا خالصا لوجهه سبحانه» وأن يكون نافعا فيما 
قصد به إنه ولي ذلك والقادر عليه وآخر دعوانا أن الحمد لله رب العالمين. 
أ.د. حشمت قاسم 
القاهرة 


جمادى الآخرة 475 ١ه‏ / أبريل» 5١١٠م‏ 
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تصدير الطبعة الثانيهة 


مايقرب من ثماني سنوات منذ انتهيت من تأليف الطبعة الأول من هذا 
الكتاب. في يوليو عام .7٠١ ١‏ وتدل الفترة الزمنية في حد ذاتها على الحاجة إلى طبعة 
جديدة» في مجال تنظيم المعلومات واسترجاعهاء سريع التطور. يضاف إلى ذلك 
صدور أكثر من عشرين مراجعة على الأقل» للطبعة السابقة من هذا الكتاب. وتشتمل 
تلك المراجعات على كثير من الاقتراحات والتعليقات القيمة» التي لا أقدرها عاليا 
فحسبء وإنما يمكن أن أود أيضا تضمينها في هذا الكتاب. وقد أصبح هذان السببان 
يجتمعين» فيم| بعد العامل المحفز لتأليف هذه الطبعة الثانية. 

وبين| تم تحديث الكتاب كاملا ومراجعته » تشتمل القائمة التالية على بيانات 
التعديلات الجوهرية التي أدخلتها على كل فصل في الطبعة الحالية: 

« الفصل الأول: إضافة قسم جديد؛ 5/7/١/١‏ عن كارن سبارك جونز 
(1935-2007) ععصمل عاءعمقمك وعمدا1. 


«الفصل الثاني: إضافة قسمين جديدين؛ 5/١/7”‏ التمييز الاجتماعى 
8م اون50.: و؟7/ 9/ /١‏ ؛ محتوى المواقع الثرية 1855. 
© الفصل الثالث: إضافة قسم جديد؛ 9/ 7/7/١‏ محددات هوية الكيانات 


الرقمية 2)111©15ع10 أعء 0 لهازع1لآ. 
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«الفصل الرابع: إضافة ثلاثة أقسام؛ ١/5/4‏ التقسيمات الهرمية 
315 وغ / :/ ١‏ التصنيفات المتعارف عليها 5011!2502012165. و5/ 5/ ”* 
والتصنيفات التخصصية كءأعه1مغه0. 

الفصل الخامس: إضافة عملية البحث / استرجاع خدمات العنكبوتية 
(510377) عع لمعك طء1١‏ عحلاء ا/طعموء8. والبحث / الاستر جاع عن طريق 
المحدد الموحد لمكان المصدر ([5141) آغ01] 912 ءلاء ماع82 / طعروء5: إلى القسم 


/١5/١0‏ : البحث في مراصد بيانات متعددة 8صتطءعدء5 عسقطهند1 ع1منغلت31. 


« الفصل الثامن: إضافة الجيل التالي من الفهارس المتاحة على الخط المباشر 
5 إلى القسم 8/ ” الفهارس المتاحة على الخط المباشر 0246©05: الفهارس 
الإلكترونية للمكتبات بوصفها أنظمة لاسترجاع المعلومات؛ وإدخ ال تعديلات 
جوهرية على القسم 8/ 5/7/5 أساليب الترتيب الطبقيء وإضافة قسم جديد 
7/0 العنكبوتية ١.١‏ ونظم استرجاع المعلومات. 

© الفصل التاسع: تعديلات جوهرية في القسم 4/ ١‏ المعلومات متعددة 
اللغاتء والقسم 9/”/" استرجاع الأصوات» والقسم 7/7/9 استرجاع 
الصور المتحركة. 

« الفصل العاشر: إضافة قسم جديد ١٠/7/؟‏ الناذج الأخرى لاسترجاع 
المعلومات التي تركز على المستفيد» وإضافة واجهة المستفيد العضوية عكنا عتصهع0 
(0101©) ععهقمعاهة إلى القسم 5/١/7 /٠١‏ نهاذج أخرى لتفاعل المستفيد مع النظام. 
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«الفصل الحادي عشر: حذف القسم 7١/1/١١‏ معايير تقييم نظم 
الأسطوانات الضوئية المكتنزة 35طءعؤة(5 /010-1201) 105 وأسعاضس دمأغهداله؟8. 
وإضافة القسمين /١/١١‏ 4 معايير تقييم نظم الاسترجاع متعددة الوسائطء. 
و١1/‏ 5/5 القابلية للاستخدام بوصفها معيارًا للتقييم» وإدخال تعديلات جوهرية 
في القسم /١/7 /*/١1١‏ 5 مهام الاسترجاع. 

« الفصل الثاني عشر: التوسع وإجراء مراجعات جوهرية» تشمل حذف القسم 
١ ١/7‏ أنموذج اللغة الطبيعية» وإضافة أقسام جديدة؛ /١7‏ ؟/ ؟ التلخيص الآلي. 
و؟١5/1/‏ ” الرد على الاستفسارات» و؟7١/‏ ؟/ 5 البحث في اللغة الطبيعية» و7١/‏ 7 
العنكبوتية الدلالية. 

وفضلا عن ذلك, أود أن أوضح أن بؤرة اهتمام هذا الكتاب وتوجهه يستندان 
إلى ما تلقيت من تلقيم مرتد :566058616 حول الطبعة السابقة. ونتناول تنظيم 
المعلومات واسترجاعها 11816. بادئ ذي بدء؛ من منظور علم المكتبات والمعلومات» 
لآ من وجهة نظر علوم الحاسب. ومن ثم فإن دقائى تصميم النظم وتنفيذهاء 
كالخوارزميات كتصطا :معت على سبيل المثال» لم يتضمنها هذا الكتاب. وثاني» تمت 
معالجة طرق تنظيم المعلومات بوصفها مكونا ل غنى عنه في عملية استرجاع 
المعلومات؛ لا بوصفها مجالا موازيا لاسترجاع المعلومات. وههذاء فإن تغطية طرق 
تنظيم المعلومات في هذا الكتاب» أقل حجر من تغطية أساليب استرجاع المعلومات. 
الثاء لم تحظ موضوعات معينة (كسلوكيات البحث عن المعلومات مثلا) إلا بمعاجة 
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موجزة في هذا الكتاب» وذلك لسببين: (١)لم‏ يقصد بهذا الكتاب معالجة هذه 
ا موضوعات باستفاضة» (؟) يمكن الحصول على تغطية تمتازة هذه الموضوعات في 
مصادر أخرىء وردت على وجه التحديد بوصفها مراجع في نهاية الفصول 
المتصلة عها. 

وأود أخير اشكر جامعة لو نج أيلاند 113أوء نهآ 50داه1 عدم.1 لمنحي 
إجازة تفرغ» ما كان من الممكن لي بدونها أن أتمكن من تأليف طبعة جديدة من هذا 
الكتاب. كما أني أعترف بكل التقدير للجهود التي بذهها مساعدي, طالب الدراسات 
العليا فنفاي أويانج 01118 أعلمع "1 في تجميع المادة لي. وفضلا عن ذلك فإنني أقدر 
فعلا مشورة وتوجيه سامانتا هيستنجز 113501285 531228120118 نحرر سلسلة كتب 
الجمعية الأمريكية لعلم وتقنيات المعلرمات 55165 طمهمع21020 45151 
150140 وآمي ريف 186676 '2د4ء المحرر التنفيذي للكتب,. وجون بي. بريانز 
5طةنز8 .8 ططمل» رئيس التحرير والناشره بمؤسسة حاضر المعلومات 
.هآ 10023 دمتأأاهدم60م1؛ في أثناء إعداد الطبعة الحالية. وإنها لمتعة فعلا أن أعمل 


مع كل هؤلاء جميعا ]| هو ا حال دائما. 
هتنج نشو 


لونج أيلاند. نيويورك 
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تصدير الطبعة الأولى 


كتاب آخر حول استرجاع المعلومات؟ نعم لأن هناك موضوعات وتطورات 
جديدة بحاجة لأن تعالج في هذا المجال» ونحن على مشارف العصر الرقمي. يضاف 
إل ذلك عرو تسلين امدق تارق نظت اللرمنات معدل وق ااذه لكي 
تصبح المعلومات قابلة للاسترجاع. 


ونبدأ بنظرة شاملة على طرق تنظيم المعلومات واسترجاعهاء في الفصل الأول؛ 
الذي يلقي نظرة على المفاهيم الأساسء والأعلام الأساس, والأحداث الأساس» 
ومراحل التطور الجوهرية للمجال. ويتناول الفصلان الثاني والثالث المقاربات 
الأساس لطرق تنظيم المعلومات؛ والموضوعات الأخرى المتصلة بذلك. ونظراً لأهمية 
اللغة في تنظيم المعلومات واسترجاعها؛ يناقش الفصل الرابع اللغة الطبيعية واللغات 
المقيدة» نوعي اللغة المستخدمين في المجالء بالإضافة إلى علاقات هذين النوعين 
وخصائصههما. وتركز الفصول الخامس والسادس والسابع على مختلف أوجه 
الاسترجاع؛ إجراءات الاسترجاع. ومقاربات الاسترجاع. ونماذج الاسترجاع. ثم 
نتناول بعد ذلك الفئات الرئيسة لنظم استرجاع المعلومات؛ وذلك في الفصل الثشامن» 
مع اهتمام خاص بنظم استرجاع الإنترنت. النجم البازغ في أسرة نظم استرجاع 
المعلورمات. ويستكشف الفصل التاسع استرجاع المعلومات متعددة اللغات. 
ومعلومات الوسائط المتعددة. والمعلومات فائقة التنظيم 0ع ناعنصوتءصوط. 
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ويحظى البعد الخاص بالمستفيد» وهو جانب جوهري في تنظيم المعلومات 
واسترجاعهاء بالتغطية في الفصل العاشر. ويستعرض الفصل الحادي عشر قضية 
التقييم المعقدة» متعددة الجوانب في المجال» ويشمل مقاييس التقييم» وطرق التقييم» 
ومشروعات التقييم الكبرى. ويحلل آخر فصول هذا الكتاب؛ وهو الفصل الثاني 
عشرء دور الذكاء الاصطناعي واحتالاته في تنظيم المعلومات واسترجاعها. 

ولقد حاولت تقديم نظرة منطقية شاملة» وإن كانت غير تقنية للمجال؛ 
باستعمال لغة جلية بسيطة» حيع| أمكن ذلك» لشرح موضوعات معقدة. وينصب. 
تركيز هذا الكتاب على مبادئ وأسس تنظيم المعلومات واسترجاعهاء لا على وصف 
إجراءات أو نظم أو ممارسات بعينها ني المجال. وبمجرد أن يلم القارئ بمبادئ 
وأسس تنظيم المعلومات واسترجاعها هذه؛ فإنه يمكن أن يصبح قادرا على تطبيق 
هذه المبادئ والأسس في مختلف المواقف والبيئات. كذلك نولي الاهتمام؛ على وجه 
التحديد. للموضوعات والتطورات في يتعلق بتنظيم المعلومات واسترجاعها في 
العصر الرقمي. 

وبين| يتوجه " تنظيم المعلومات واسترجاعها” نحو المستفيد فإنه يمكن 
لمصممي نظم معالجة المعلومات واسترجاعهاء أن يجدوا هذا الكتاب مفيدا بالنسبة 
للإلمام بالمجال من منظور المستفيدين. وأهدف هنا إلى كتاب يمكن أن يكون مفيدا 
لكل من يبتم بالإحاطة بالمجال» وخصوصا أولئك الوافدين إليه حديثا. وأوصي بقوة 
بأن يقرأ المبتدئون الكتاب بالترتيب الذي ورد به محتواه» نظراً لأن الفصول المتأخرة 
تستند إلى الفصول المتقدمة. 

وبنظرة إلى ما مضىء فإنه ربما لم يكن لي أن أؤلف هذا الكتاب, في هذه المرحلة 
من حياتي المهنية؛ ما لم يبادر زميلٍ ريتشارد سميراجليا قتاع عنددذ لعقط 11 
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بالاتصال المباشر من أجلي. وأعرب عنن امتناني أيضا لتلاميذي الذين شاركوني 
اهتامي بالمجال وحماسي له. كما أقدر أيضا إجازة التفرغ التي منحتني إياها جامعة 
لونج أيلاند؛ فم| كان من الممكن بدون هذه الإجازة أن تشاح فسحة الوقت اللازم 
لإنجاز هذا المشروع. كما أود أن أشكر مايكل كونيج 8ندءه1 [8ط811؛ عميد 
معهد بالمر 5001 معتماقط الذي أنتسب إليه؛ وجون بريانز وصهئزم8 سصطملء 
رئيس تحرير قسم نشر الكتب بمؤسسة حاضر المعلومات 10083 10522)158مآ1 
.]؛ لأنها جعلا نشر مسودتي حقيقة واقعة. 

ولقد كان هذا الكتاب». وإلى حد بعيد» جزءا لا يتجزأ من حيات العائلية؛ في 
أئناء التأليف؛ لأن زوجي وابنتي كانا أيضا منخرطين بعمق في عملي» إذ أصبح هذا 
الكتاب». على سبيل المثال» موضوعا منتظيما للحديث على مائدة العشاءء وغالبا ما 
كانت أسرتي تقضي خباية الأسبوع وساعات المساء بدوني في المنزل. وربما كانت ابتتي 
فانجفاي أءأعمه! أكثر تعرضا ”“لاسترجاع المعلومات”' من أي أطفال آخرين ف 
سنها؛ فقد كانت تحثني باستمرار على العمل في كتابي» على الرغم من أنها كانت في 
قرارة نفسهاء ربم| تفضل أن أقضي الوقت معها. ولقد كان ما حظيت به من حب 
وتفاهم ودعم من أسرتي» مصدرا للطاقة والإلهام على الدوام. 

عور 


لونج أيلاند» نيويورك 
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الفصل الأول 


تنظيم المعلومات واسترجاعها؛ نظرة عامة 


يرجع تنظيم المعلومات واسترجاعهاء الذي يعرف أيضا بالاستخلاص 
والتكشيف والبحث علن)المعلومات ومعالجة المعلومات وإدارتهاء إلى النصف الثاني 
من القرن التاسع عشرء حين| وضعت خطط لتنظيم المعرفة والوصول إليها (كتصنيف 
ديوي العشري على سبيل المثيال عله )١41/‏ (1980 ,7هم:17). إلا أن البحث في 
تنظيم المعلومات واسترجاعها لم يصبح مجال/رزئيسا في علم المعلوماتء إلا بعد نشوب 
الحرب العالمية الثانية. ومنذ ذلك الحين تتجه عقو ل#نيرة ا مختلف المجالات» نحو 
هذا المجال الناشئ» بيني تستخدم تقئيات المعلومات ##ي جات متفاوتة من التقدم 
والنضج. لتيسير البحث والتطوير في تنظيم المعلومات واسترجاعها. 

ويتسم تاريخ تنظيم المعلومات واسترجاعها هنا وتطوره. بالتركيز على الملامح 
الرئيسة لكل فترة زمنية» والرواد البارزين في المجال. ومن ثم فإن المفاهيم الرئيسة التي 
يتضمنها هذا الكتاب تحظى بالمعاجة» مشفوعة بمناقشة للمكونات الجوهرية لتنظيم 
المعلومات واسترجاعها. ونختتم هذا الفصل بمحاولة استكشاف المشكلة الجوهرية 
للمجال؛ وهي كيف يتم الحصول على المعلومات المناسبة للمستفيد المناسب في 


الوال الناسب. 
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تاريخ وتطور تنظيم المعلومات واسترجاعها: 

تاريخ تنظيم المعلومات واسترجاعها ليس بالبعيد. وتحدد النظرة الراجعة 
للمجال معالم الطلب المتزايدء والنمو السريع. ومرحلة إزالة الغموض 
0 وووحتقبة المشابكة» بوصفها المراحل الأربع الرئيسة التي 0 ا 
تنظيم المعلومات واسترجاعها في تطوره. 


المراحل الرئيسة: 


الطلب المتزايد (أربعينيات القرن العشرين - مطلع خمسيئيات القرن نفسه): 
شهدت الحرب العالمية الثانية الميلاد الرسمي لمجال تنظيم المعلومات 
واسترجاعها؛ فنظرا لظروف الحرب. تم إنتاج عدد هائل من التقارير التقنية والوثائق اللتي 
تسجل وتوثق أنشطة البحث العلمي والتطويرء المرتبطة بإنتاج العتاد الحربي. ولا يمكن 
للإنسان مواجهة مثل هذه المهمة الضخمة لتنظيم المعلومات واسترجاعهاء دون النظر في 
الجوانب الأخرى لمعالجة المعلومات وإدارتهاء كالانتقاء» والبث والحفظ. وىا ذهب بوش 


(ذ194) أكعباظ: 


هناك جبل نام من البحوث,. إلا أن هناك دليلا متزايدا على 
أننا نغوص اليوم في مستنقع» نظرا لتزايد التخصص. ويترنح 
الباحث تحت وطأة نتائج وخلاصات جهود الآلاف من الباحثين 
الآخرين: تلك الخلاصات التي لا يتسع وقت الباحث 


لاستيعاءهاء وناهيك عن تذكرهاء عندما تظهر (8.101). 
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حقاء لقد أصبحت الحاجة إلى تسجيل الكميات الهائلة من المعلومات 
وتنظيمها واضحة تماماء وضاغطة أيضاً؛ ففي مجالات الفيزياء والأحياء على سبيل 
المثال: 
يقدر ما ينشر في العلوم البيوطبية 011 على سبيل 
المغشالء» بمليوني بحث سنويا > «أءسم[3 ,كدء الم )»ء11) 
(147 .2 1064 1 وويمكن الاطلاع على هذه البحوث 
بمعدل اثنين في الساعة» إذا سلمنا بأن القارئ يقظء وبإمكانه 
القراءة بحواللىي سبعين لغةء والوثائق في متناول يديه. وإذا كان 
الاطلاع على الدوريات يقتصر على ساعة واحدة يومياء و7508 
يوما في العام» فإن الاطلاع على إنتاج عام واحد من النتاج 
الفكري العالمي في العلوم البيوطبية» يمكن أن يستغرق أكثر من 
"٠‏ قرنا (6 .م ,1975 ,رء711رء8 يل 807/0). 


وعلى الرغم من أنه قد لا يكون من الممكن التعرف على الكم الفعلي 
للمعلومات التقنية» التي تم إنتاجها في العقدين الخامس والسادس من القرن 
العشرين؛ على وجه الدقة» فإنه من الممكن تقدير كم هذه المعلومات» وفقا لمجال 
العلوم البيوطبية الذي سبقت الإشارة إليه. ولم يعد بإمكان البشر الاعتاد عل 
مهاراتهم وذاكرتهم أو إمكانات الملفات الشخصية دون سواهاء من أجل تنظيم 
المعلومات واسترجاعها بكفاءة؛ كلما دعت الحاجة إلى ذلك. وإنها تطلب الأمر 
الاعتهاد على الجهود الجماعية في مجال تنظيم المعلومات واسترجاعهاء ما أسفر عن 
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النظم المصممة خصوصا لذلك الغرضء حتى وإن كانت نظ يدوية؛ كالكشافات 
الترابطية 5ععزء 1:10 200701714160 التي ظهرت عام 91١‏ ١(111956ن2).‏ 
النمو السريع (من خمسينيات القرن العشرين حتى ثمانينياته): 
تفل عقود هذه الفترة السنوات الذهبية في تطور تنظيم المعلومات 
واسترجاعها؛ فقد دخلت الحاسبات رسميا إلى المجال فيما بين عامي ١961/‏ و909١»‏ 
عندما استخدم هانز بيتر لون 17/إلد1 26167 776715 حاسبا لا لمعالجة مضاهاة الكلمات 
المفتاحية ومهام الفرز فحسب. وإنما للعمل الفكري المتصل بتحليل مضمون 
النصوص التحريرية أيضا (1987 ,56/10). 
ويدل ظهور نظم انط المباشر 0711116 مثل ديالوج 607 نإف ستينيات 
وسبعينيات القرن العشرينء على التحول من الاسترجاع اليدوي إلى الاسترجاع 
الإلكتروني للمعلومات. وقد وصف هان (1996) 14 نظم الخط المباشر الراكئدة» 
التي تطورت في ذلك الوقت قائلا: 
لقد كانت تتمتع ببعض الملامح المتطورة البارزة» كمكانز 
الخط المباشر والمخرجات المرتبة طبقياء وإدخ ال المترادفات» 
تلقائيا في صيغ أو استراتيجيات البحث. والمنطق البوليني» وبتر 
كواسع الكلمات وصدورهاء والبحث في المراجع المستشهد بهاء 
وبحث النصوص الحرة للغة الطبيعية. وكانت بعض النظم 
تتضمن برامج لتجميع البيانات لمراقبة الإفادة من النظم ومدى 
الرضا عنها (34 .5). 
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وإلى جانب نمو نظم الخط المباشر ونضجهاء تم تطوير أساليب آلية وتلقائية 
لتنظيم المعلومات واسترجاعهاء وإجراء التجارب على هذه الأساليب» مدعومة 
بالتطورات التي شهدتها تقنيات استخدام الحاسبات أو الحوسبة. وكرست عناصر 
بشرية من مختلف المجالات» وخصوصا علوم الحاسب, جهودها للبحث والتطوير في 
هذا المجال, إلا أنه كانت هناك مشكلات أخرى تنتظر البحثء. كما أوجز سالتون 
(1987) :52110 في أحد أعماله: 
على الرغم من أن قدراً كبيرا من التقدم قد تحقق. خلال 
السنوات الثلاثين الماضية:؛ في معالجة النصوص واسترجاع 
المعلومات» وخصوصا ني قطاعات تحرير النصوص وإنتاج 
الوثائق. وتحديد أو تعيين المصطلحات الكشفية؛ والتجميع 
الديناميكي لعمليات البحث وصياغة الاستفسارات. فإنه لا يبدو 
هناك سوى تطورات جوهرية محدودة في مجالات الاستيعاب 
ا حقيقي للنصوص (379 .8). 
مرحلة إزالة الغموض (ثانينيات القرن العشرين وتسعينياته): 
على الرغم من أن نظم الخط المباشر التي سبقت الإشارة إليها كانت مصممة 
للمستفيدين ذوي الفئات المختلفة من الاحتياجات المعلوماتية» فإن تلك النظم لم تكن 
مصممة على النحو الذي يكفل للمستفيدين إجراء عمليات البحث فيها مباشرة؛ دون 


أي تدريب أو مساعدة من اختصاصيي المعلومات. وبعبارة أخرى فإنه لم يكن هناك 
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سوى الوسطاء كاختصاصيي المكتبات وغيرهم من اختصاصيي المعلومات» من 
يستطيعون إنجاز مهام البحث نيابة عن المستفيدين. وفضلا عن ذلك كانت الإفادة 
من مثل هذه النظم باهظة التكلفة» من أجل الوصول إلى المعلوماتء نظرا لتقاضي 
مجموعة ضخمة من الرسوم (كرسوم الاتصالات بعيدة المدىء. والربط. ورسوم 
مراصد البيانات؛ على سبيل المثال) وذلك مقابل عملية بحث واحدة. وكان مصطلح 
المستفيد النهائي يدل حينئذ على أولئك الذين يحتاجون إلى نوع ما من المعلومات» 
فلكتو 1 كواب زع زلا عر ضف جنل ال اللداكى مع اضيب ركد 
تغير معنى مصطلح المستفيد النهائي تدريجياء عندما بدأ استخدام الحاسبات الشخصية 
في استرجاع المعلومات» وعندما بدأت نظم الأسطوانات المكتنزة /202-1801 
والفهارس المتاحة على الخط المباشر (084)6005). تطبق في منتصف ثإنينيات القرن 
العشرين : 

لقد كان التعامل مع نظم استرجاع المعلومات على الخط المباشر يتم » فيا مضى 
عن طريق وسائل متنوعة, كالمنافذ الطابعة /167711::4 7171/67م. ومنافذ أنبوبة أشعة 
المهبط (6781). ومن نافلة القول أن التفاعل بين من يقوم بإجراء عمليات البحث من 
جهة. والنظام من جهة أخرىء لم يكن جاذبا أو متعاطفا أو ميسرًا. وعندما دخلت 
الحاسبات الشخصية إلى استرجاع المعلوماتء تبين للمستفيد النهائي أن عملية 
الاسترجاع كانت تبدو أقل رهبة ئما كانت عليه بكثير؛ نظرا لأنه أصبح من الممكن 
إجراء شكل ما من *“المحادثة'“ الودية» أو التفاعل بين المستفيد والنظام. 


وقد أدى تطبيق نظم الأسطوانات المكتنزة 082-1014» والفهارس المتاحة على 
الخط المباشر 024)005). إلى أن يصبح من الممكن للمستفيد النهائي إجراء عمليات 
البحث لنفسه؛ وذلك بالقضاء على غموض نظم استرجاع المعلومات الذي كان قائ| 
من قبل» في شكل الخط المباشر فقط. ى| كان هؤلاء المستفيدون موزعين جغرافيا في 
أماكن نائية؛ ولم يعودوا بحاجة لأن يحفلوا بتكلفة الخط المباشرء عندما يقومون 
بالبحثء وذلك في نظم الأسطوانات المكتنزة» والفهارس المتاحة للجمهور على الخط 
المباشر. ومنذ ذلك الحين أصبحت نظم استرجاع المعلومات» وعلى نحو متزايد» نظم) 
مصممة للمستفيدين النهائيين ولتستخدم من جانبهم. 
حقبة المشابكة (منذ تسعينيات القرن العشرين حتى الآن): 

لقد كان استرجاع المعلومات حتى ذلك الوقت نشاطا مركزياء ما يعني أن 
مراصد بيانات نظم استرجاع المعلومات كانت تدار ماديا في موقع مركزي واحد. وإذا 
كان هناك من يرغبون في الإفادة من عدة نظمء كان عليهم إقامة علاقات مع نظم 
الاستر جاع المعنية كل على حدة. وفي مقابل ذلك. يكفل البحث اللامركزي 
للمستفيدين. الوصول إلى معلومات مراصد البيانات» باستخدام البنية الأساس 
للمشابكة 1/6 610011. ولم تعد نظم استرجاع المعلومات تقتصر على 
منطقة جغرافية واحدة. وقد جعل ظهور الإنترنت من استرجاع المعلومات التشابكي 
حقيقة واقعة. بتوفير البنية الأساس اللازمة لهذا التطبيق. 

وبالإضافة إلى مقومات البحث اللامركزيء أدت الإنترنت إلى إعادة تحديد 
معالم مجال تنظيم المعلومات واسترجاعهاء فلم يحدث من قبلء في تاريخ تنظيم 
المعلومات واسترجاعهاء أن استخدمت الكلمات المفتاحية الإحصائية. وغيرها من 
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الطرق الماثلة» بهذا القدر من الكثافة» في مثل هذا القدر الحائل من التنظيم الفائق 
6 ومعلومات الوسائط المتعددة. وم يحدث مطلقا من قبل في تاريخ 
استرجاع المعلومات أن قام كثير من المستفيدين بإجراء عمليات البحثء على الخط 
المباشر دون مساعدة الوسطاء. ونتيجة لذلك يبدو طابع تنظيم المعلومات في هذه 
البيئة» مختلطاً إلى حد أن مصطلح الأزمة المنظمة 05 01871164 قد تم سكه 
خصوصًا لوصف الوضع الراهن. ومن ناحية أخمرى» أصبح استرجاع النصوص 
الكاملة هو القاعدة وليس الاستثناء» على الإنترنت. وتتاح الآن أساليب الاسترجاع 
التي كانت فيها مضى تقتصر على مختبرات التجاربء وتتاح الآن يسهولة في نظم 
استرجاع الإنترنت» كألتافيستا 64 411 وجوجل 000816. وتطبق الآن النتائج 
العامة للبحوث التي يمكن الحصول عليها من البيئات التجريبية المنضبطةء على نطاق 
واسع. لتنظيم المعلومات واسترجاعها على الإنترنت. 

وتتمثل حقبة المشابكة في الإنترنتء التي توفر منصة جديدة:» ونافذة عرض 
لتنظيم المعلومات واسترجاعها في العصر الرقمي. 
رواد المجال: 


اجتذب مجال تنظيم المعلومات واسترجاعها كثيرا من الموهوبين المهتمين» في 
السنوات الخمسين الماضية» إلى حد أنه لا يمكن عمليا الإحاطة بكل هؤلاء في هذا 
المقام. إلا أن ما نورد فيا بعد من أعلام» يستحقون المعالجة كل على حدة في هذا 
الكتاب؛ لأن إسهاماتهم في المجال جد عظيمة. والمعيار الآخر لاختيار رواد استرجاع 
المعلومات في هذا القسمء أن جميعهم قد اختتموا حياتهم الأكاديمية وقت تأليف 
هذا الكتاب. 
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مورقيمر تقاوبه :)1516-151٠١(‏ 
حصل مورتيمر تاوبه ©1218 «14071417:6 على شهادته للدكتوراه في الفلسفة» 
بجامعة كاليفورنيا في بركليٍ براع 811 نت مأنصم ]1ه 0 11 «0::1. وقد عمل 
اختصاصيا للمكتبات. في الإعارة» والفهرسة؛ والتزويد قبل أن يشغل منصبا في مكتبة 
الكونجرس» ليصبح مساعدا رئيسا للمراجع العامة والوراقة أده بومناطاط عام 
06 (1978 ,57678). وفي عام ١1157‏ أنشأً تاوبه مؤسسة الوثئاقة 
11 0011611161107 حيث بدأ هو وزملاؤه استكشاف طرق جديدة لتكشيف 
المعلومات واسترجاعهاء بناء على عقد مع جهاز المعلومات التقنية للقوات المسلحة 
الأمر يكية 171/0711411011 أهء :ع1 (1993 ,[5111) دءء 5 47710 .0.5 
©2671 4. 
وقد أصبح النهج الجديد للتكشيف والبحثء يعرف في النهاية بالتكشيف 
التر ابطي 8 0007011416. وقدم تأويه مع ألبرتو طومسون ,1 10رءط|4 
7 تقريراً بعنوان ”التكشيف الترابطي للمجالات العلمية 17:6 
10 عت1دعةء 3 كزه ع ليدع 1:4 202001011016 أمام قسم الإنتاج الفكري 
الكيميائي بالجمعية الكيميائية الأمر يكية (اع3021 لهع11©711ن) :7هء 472673 في سياق 
مؤتمرها حول الوسائل الميكانيكية للتوثيق الكيميائي [71:22ه:[ع//7 071 :1/1ؤ71205ناد 
11 :217111 10 4105. ولم ينشر هذا التقرير مطلقافي دورية أو 


كتاب» إلا أن جال (1987) [2:1) ضمنه فيم|ا يعد في أحد أعماله كملحق. 
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وكانت الحاجة إلى طرق جديدة للتكشيف والاسترجاع في ذلك الوقت 
مزدوجة؛ فقد أثبت أولا العدد ا هائل من التقارير التقنية وغيرها من فئات الإنتاج 
الفكري العلمي» الذي أسفرت عنه البحوث التي أجريت في غضون الحرب العالمية 
الثانية» عدم ملاءمة نظم التكشيف والاسترجاع القائمة» التي كانت يدوية في المقام 
الأول. ثانياء لم تكن الطريقتان الراسختان لتنظيم المعلومات» وهما الطريقة الحجائية» 
والطريقة الهرمية (أي رؤوس الموضوعات وخطط التصنيف) قادرتين على استيعاب , 
المجالات التخصصية الحديدة» والتقنيات الجديدة» والمصطلحات الجديدة:» التي 
أسفرت عنها جهود البحث والتطوير المتصلة بالحرب العالمية الثانية (1993 ,572/7). 
وحدث في هذه الظروف على وجه التحديد, أن اقترح تاوبه وطومسون, عام 1957»؛ 
التكشيف الترابطي (1987 ,2:11 ). 

وباختلافه عن الطرق التقليدية للتكشيف والبحثء يقوم التكشيف الترابطي 
على استخدام المصطلحات الأحادية 17:1/6775» وتطبيق المنطق البوليني في استرجاع 
المعلومات. والمصطلحات الأحادية مصطلحات مفردة» يختارها المكشفون للدلالة 
على الجوانب المختلفة للوثائق. ويمكن النظر إلى المصطلحات الأحادية» على نحو ماء 
بوصفها الكلمات المفتاحية لأيامنا هذه؛ نظرا لأن كليهما يشتق من الوثائق الأصلية» 
ولا يبذل أي جهد من أجل التحكم في المصطلحات (كمراجعة المترادفات والمشترك 
اللفظي 5اتره07:087/ على سبيل المثال). وعادة ما يتم استعمال عدة مصطلحات 
أحادية للدلالة على محتوى وثيقة ماء | هو ا حال بالنسبة لتكشيف الكلمات المفتاحية. 


48 


أما المنطق البوليني ©1081 80016071 وهو أحد فروع الفلسفة» فقدطوره 
جورج بول 80016 660786 عام 1844 بناء على تحليلاته لعمليات البرهنة 
8 البشرية» والقوانين الأساس التي تحكم العمليات العقلية ,/5711) 
(1993. وكانت عمليات البرهنة في نظر بولء إما إضافة مفاهيم أو فئات مختلفة من 
الأشياء» لتكوين مفاهيم أكثر تعقدا وإما تحليل مفاهيم مركبة إلى مفاهيم تحليلية مفردة 
أكثر بساطة (1854 ,80016). ويتم التعبير عن العملية الأولى إيجازا بمعامل و 4/72 
64107 بين| تنطوي العملية الأخرى على معاملٍ أو 07 وفيا عدا 1/01. وبعد 
قرن على وجه التقريبء أدخل تاوبه هذه المبادئ إلى مجال تنظيم المعلومات 
واسترجاعهاء في شكل التكشيف الترابطي. 

وقد أرست جهود تاوبه التراكمية في التكشيف الترابطي» الأساس بالنسبة 
للبحث البوليني في البيئة المعتمدة على الحاسبات. وإذا ما أمكن تقسيم التتخصصات 
الموضوعية إلى مفاهيم مفردة» يتم التعبير عنها بالمصطلحات الأحادية» فإنه يمكن 
استخدام الحاسبات لتنظيم المعلومات التي يتم التعبير عنها بهذا الشكل» والبحث 
عنها. وقد أفضت هذه النظرة"الثاقبة في النهاية» إلى تطوير مختلف نظم الاسترجاع التي 
تقوم بإجراء جميع فئات البحث البوليني» الموضوع الذي نستكشفه بمزيد من التفصيل 
في أجزاء أخرى من هذا الكتاب. وفي الوقت نفسه» أصبحت الكشافات التي يتم 
تطويرها باستخدام طريقة الربط» تعرف بالكشافات الترابطية. وقد سميت عملية 
البحث في هذه الكشافات. بالربط بين الأفكار للعثور على المعلومات التي تدعو 


الحاجة إليها بربط المفاهيم 21 اإززء 0122© (993 [ ,:[571111). 
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بيد أن عبارة التكشيف الترابطي تسمية غير دقيقة (1987 ,6:111). وللمزيد من 
الدقة فإنه ينبغي أن يسمى التكشيف والبحث الترابطي» أو بمصطلحات أيامنا هذه 
التنظيم والاستر جاع الترابطي أمداءتجاء ١‏ جه :110 متترعدء رمع 1011016م0ت نظ را 
لأنه لا يبدو مجرد طريقة للتكشيف. وإنما يستعمل للبحث أيضا. يضاف إلى ذلك أن 
تركيز هذه الطريقة كان ينصب على التحليل أو التحليل والتركيب ##26515اى» نما 
حدا ببعض النقاد (مثل جال 1987 ,0411© وباو 1989 ,280) للتساؤل ما إذا كبان 
التكشيف الترابطي يربط بين الكلمات أم المفاهيم أو الأفكار. كذلك كانت مشكلة 
الربط المزيف سببا في المخاوف؛ نظرا لأنه لم تكن هناك تقنية في هذه الطريقة تحول دون 
حدوث السقط"' 5م47 56ل2/. فإذا كان موضوع البحث المراده على سبيل المثال؛ 
أسطوانة | لحاسب ع[4©5 167/ات607:1. فإنه يمكن للنتائج المسترجعة أن تشتمل على 
وثائق تتصل بأسطوانة الحاسب بالإضافة إلى حاسب المكتب «ء/لام071© ع51ء4» 
وعبارات أخرى ترد ها كلمتا حاسب 6071214167 ومكتب 065/1 (كحاسب سطح 
المكتب 0177121/167© 465/10 على سبيل المثال). ولما كانت المصطلحات الأحادية يتم 
تخصيصها دون النظر في اللغات المقيدة» فإن جميع العيوب المرتبطة بالتكشيف 
والاسترجاع؛ باستخدام اللغة الطبيعية (راجع الفنصل السابع) نجدها أيضا في 
التكشيف الترابطي. وفضلا عن ذلك فإنه إذا ما كان التكشيف الترابطي يقتصر على 
الكلمات المفردة دون سواهاء فإن ذلك يبدو مجرد قيد يوضع على الطريقتين الحجائية 
والحرمية القديمتين» وليس طريقة ثالئة جديدة للتكشيف والاسترجاع 
(1987 ,للست ). 
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ومع ذلك فإنه إسهام تاوبه في المجال لا يضارع؛ إذ إنه ايتكر التكشيف 
الترابطي» وأدخل المنطق البوليني في التكشيف والاسترجاع. وكا ذكر جال 11ل 
(7956)» إيجازا فإن نظام المصطلح الأحادي أبرز الخصائص التالية» بالمقارنة 


بالتصنيف والفهرسة الموضوعية: 

٠‏ التكلفة الأقل ٠‏ الحجم الأصغر 

٠‏ التحليل الأسرع ٠‏ كفالة نقاط وصول أكثر لكل وحدة مكشفة 
« معدل التعطل الأبطأ ٠‏ التخصص الأكثر 

« الشمول » البنيان المنطقي 

« الحياد * البساطة 


« الملاءمة للنشر التراكمى 

وليس هناك أدنى شك فعلاء في أن الدافع الحقيقي للطرق الحديئة لاسترجاع 
المعلوماتء يرج ع إلى مورتيمر تاوبه منشئ مؤسسة الوثاققة 
.171 716711211011زلاء 100 (1965 ,1,27125167). وعندما ننتقل من العصر الإلكتر وني 
إلى العصر الرقمي» يظل تأثير تاوبه على التكشيف والاسترجاع واضحا بجلاء. 
هانز بيترلون (1495 - 1554): 

إذا كان تاويه ينظر إليه بوصفه الرائد الذي وضع الأساس لاستخدام الحاسبات في 
استرجاع المعلومات» بإدخال المنطق البوليني في نظام المصطلح الأحاديء فإن هانز بيتر لون 
لا 26167 17715 هو الذي ابتكر فعلا التطبيقات المعتمدة على الحاسب بالنسبة للمجال. 
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فقد كان لون. الذي ولد في ألمانياء مهندسا بالمؤهل» وأصبح مخترعا شهيرا في 
آَى ي إم 1814؟ إذ سجل أكثر من ثيانين براءة اختراع. وقد جاءت بداية لون في علم 
المعلومات بوجه عام» واسترجاع المعلومات على وجه المخنصوص. في فترة عامي 
17 و1958.ء عندما اتصل به كل من جيمس بري 2677 767165 ومالكوم 
دايصون :100501 114160177 وسألاه ما إذا كان من الممكن تصميم آلة آي بي إم 
4 للبحث في المركيات الكيميائية المشفرة 00064.» وفقا لنظام دايصون رقي 
(1978 ,لإءا712). وسرعان ما أبدى (لون) اهتماما بالموضوعء وانضم إليهما 558 
واختبار نظام إلكتروني رائد للبحث عن المعلومات» ذلك الذي أسماه لون عام 
ل ٠‏ منتقي البحث الإلكتر وني 60107أ52 1718 1[ع 5027 0:11 7ع 616 و أصبح هذا 
الجهاز يعرف في| بعد باسم ماسح (لون) الضوئي 52271167 171[لشط ,4[15ا:[5) 
. (71968. وفي عام ١4157‏ كان لون ينفق جانبا متزايدا من الوقت في استرجاع 
المعلومات» وقد نشر أول بحث له في المجال بعنوان '”طريقة جديدة للتسجيل 
والبحث عن المعلومات 3560711118 2710 100701718 [0 سولق 4 
0 '' (1953 ,71آهط). كذلك أصبح لون مديرًالبحوث استر جاع 
المعلومات بشركة آي بي إم. إذ استكشف وصمم كثيرا من تطبيقات استرجاع 
المعلومات المعتمدة على الحاسبات» التي تبدو اليوم مألوفة في الال 
ومن بين هذه التطبيقات نظام الكلمات المفتاحية في السياق (1)71/7) الذي 
ينطوي على ثلاثة عناصر أساس لتنظيم المعلومات واسترجاعهاء فالعنصر الأول هو 
أن الكلمات المفتاحية:؛ لا المصطلحات المستقاة من خطط التصنيف ورؤوس 
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الموضوعات التقليدية» تستخدم للتعبير عن جميع أوجه الوثائق واسترجاعها. ومن 
الممكن النظر إلى الكلمات المفتاحية» على نحو ماء بوصفها من أنجال مصطلحات 
تاوبه الأحادية» على الرغم من قلة من حاولوا إجراء هذا الربط. وقد اتبع هج 
الكلمات المفتاحية هذا منذٍ ذلك الوقت على نطاق واسع. في تطبيقات كالتكشيف الآلي 
والاستخلاص الآلي» والبحث بالكلمات المفتاحية. أما العنصر الثاني لطريقة الكلمات 
المفتاحية فمستمد من كشافات النخصوص 201120170071065 التي ابتكرها أسلافنا في 
القرن الثالث عشر (1995 ,[ء17/]!15). وبينا تشكل جميع الجمل في وثيقة ما كشافا 
للنصء تشكل العناوين وما شامبها من عناصر وظيفية (كالجمل التي تدل على 
موضوعات الفقرات 567167265 216/ أو العناوين الفرعية) ما يسمى السياق 
بالنسبة لكشافات الكلمات المفتاحية في العنوان (1617/1:1) 13116 2جة #ر0/لا برمكل أحد 
امتدادات تطبيق الكلمات المفتاحية في السياق ©5117. أما العنصر الثالث في مج 
الكلمات المفتاحية في السياق» فهو تباديل الكلمات المفتاحية الواردة في العناوين 
والمقابلات الأخرى. وعادة ما تتخذ التباديل شكلين للعرض؛ أولها الكلمات 
المفتاحية في السياق؛ إذ ترد كلمة مفتاحية بعينها في وسط السياقء وكلمة مفتاحية 
خارج السياق (107/00) آندء0111) 0/6 0111 171/070 عل حيث تعرض كلمة 
مفتاحية بعينها وترد خارج السياق. والكلمات المفتاحية خارج السياق» شأنها في ذلك 
شأن الكلمات المفتاحية في العنوان» أحد أشكال تطبيق الكلمات المفتاحية في السياق. 
وقد أنتج لون الذي سك مصطلح الكلمات المفتاحية في السياق 1611/10 عام /115» 
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بنجاح كشافا للكلمات المفتاحية في السياق للعناوين الكيميائية©) 11115 امعتدء ةن 
ليصل بفكرته إلى نتيجة عملية (1966 ,150161 1). ونمج الكلمات المفتاحية في السياق 
معلم واضح ولا شك,. في تنظيم المعلومات واسترجاعها. 

ويمثل التكشيف الآلي والاستخلاص الآلي إسهامات جوهرية:؛ قدمها لون 
لمجال استرجاع المعلومات؛ فباستخدام الطرق الإحصائية» طور لون وروج 
خوارزميات لإنتاج الكشافات والمستخلصات آليا. وفيا يتعلق بالتكشيف الآلي» 
تستند الإجراءات في المقام الأول إلى التقاط الكلمات المهمة (أي الكلمات المفتاحية) 
التي تحمل دلالات» من الوثائق. أما الكلمات التي ترد بكثافة (أي الكلمات عالية 
الترود كأفؤانت العكن والعريف» حرو العطتة دووف 31 )أو الكليات 
التي نادرا ما ترد بالوثائق (أي الكليات منخفضة التردد أو الكلمات التي نادرا ما 
يستعملها البشر فى الانصال) والكلمات التي لا تحمل دلالة أو معلومات 
45 710111/277111718 (كالأسماء العامة كتقرير وملخص. وكذلك المصطلحات 
التي تستعمل دائه| في صيغة أو عبارة نحوية بعينهاء مثل ”استرجاع المعلومات“(*”) 
في مرصد بيانات للوثائق» لأغراض استرجاع المعلومات) فيمكن استبعادها 
باستخدام قائمة للكليات المستبعدة 1154 07#*«-مم,ى. أو بأحد أساليب إحصاء تردد 
الكلات (1958 ,#7/ادآ). وقد أصبح هذا النهج في إنتاج كشافات الكلمات المفتاحية في 
(') حدمة إحاطة جارية في محال الكيمياء. (المترحم) 
(**) تسمى الكلمات الوظيفية أو النحوية» إذ تؤدي وظيفة نحوية ولا تحمل دلالة موضوعية. (المترحم) 
(:**) كمضاف ومضاف إليه» أو صفة وموصوف. (المترجم) 
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السياق» وتنويعاتها كالكلمات المفتاحية خارج السياقء والكلمات المفتاحية في العنوان» 
وكشافات الكلمات المفتاحية الأخرى . وحتى يومنا هذاء هي طريقة التكشيف الآلي 
الكامل الوحيدة. وفيا يتعلق بالاستخلاص الآلي» اقترحت طريقتان للتحقق من 
الكلمات المهمة» ثم الجمل المهمة التي يمكن أن تكون أكثر قدرة على تمثيل وثيقة 
معينة. ويشكل نبج الكلمات المفتاحية» كا سبقت الإشارة إليه؛ في سياق التكشيف 
الآلي» إحدى طريقتين لبناء المستخلصات الآلية. وتعتمد الطريقة الأخرى على الموقع 
النسبي للكلمات المهمة في الجملة. وبناء على ما ذهب إليه لون (1958) :”اسك فإن 
تقارب أربع أو خمس من الكليات غير المهمة بين الكلمات المهمة؛ يبدو أمرا مفيدا 
بالنسبة لالتقاط الجمل المهمة من وثيقة ما. ويبدو الجمع بين تردد الكلمات المفتاحية؛ 
وتقارب الكلمات المفتاحية في جملة ماء طريقة مناسبة لتوليد المستخلصات الآلية. 
ولقد كان إسهام لون البارز الثالث في مجال تنظيم المعلومات واسترجاعهاء هو 
تطوير نظم البث الانتقائي للمعلومات (إس دي آي 58/1)؛ فالبث الانتقائي 
للمعلومات أسلوب للبث الفعال للمعلومات العلمية الجديدة. إلى المستفيدين 
المستهدفين» بناء على سياتهم 7017/65 ». وقد بين لون (1961) :ندا معالم مقومات 
البث الانتقائي للمعلومات» ومختلف خطوات إدارة نظام هذا البث» ومن بين هذه 
المقومات يبدو وضع وصيانة سمات المستفيدين أهم المهام وأكثرها حيوية. وتشتمل 
سمات اهتمامات المستفيد على قائمة بالكلمات بالإضافة إلى أوزانها الراهنة» و تخضع 


(") بيان اهتماماتهم الموضوعية؛ والخصائص اللغوية والنوعية لا يفضلون من وثائق. (المترحم) 
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سمات المستفيد للمراجعة والتعديل تبعا لما يطرأ على اهتمامات المستفيد واحتياجاته من 
تغير. ثم تضاهى السمات بعد ذلك مقابل ما يمثل الوثائق (كالمستخلصات أو 
المصطلحات الكشفية)» وذلك على فترات زمنية محددة (أسبوعيا أو شهريا على سبيل 
المثال). وكما تصور لون فإن بالإمكان تصميم نظم ذكية: لإدارة الأعمال؛ والنشاط 
العلميء والأنواع الأخرى من الإنتاج الفكري» وذلك بتطبيق مفهوم البث الانتقائي 
للمعلومات (1968 ,675 ا516). 

وما لا شك فيه» أن لون قد وضع أفكارا قليلة حقا في حيز التطبيق لتنظيم 
المعلومات واسترجاعهاء بمساعدة الحاسبات» حتى وإن لم تكن كل هذه الأفكار 
من ابتكاره (1968 ,516/615 +1995 [1150ا/1). ولما كانت جميع التطبيقات التي 
سبق ذكرها تعتمد على الحاسبات» فإن كفاءة تلك العمليات المتضلة باسترجاع 
المعلومات قد تطورت على نحو جوهري. إلا أن هذه التطبيقات لا يمكن أن تبلغ 
مستوى الجودة التي تتمتع مها بوجه عام الكشافات والمستخلصات ومهام الاسترجاع 
التي تتم يدويا. 


وقد أكسبت لون إسهاماته في المجال» وخصوصا في تنظيم المعلومات 
واسترجاعهاء مكانة مرموقة في تاريخ علم المعلومات». الذي يشكل فيه استرجاع 
المعلومات مكونا رئيسا. واعتمادا على تحليل أعده كارلوس كوادرا ه7لهلت كملمم0) 
(1964)» تصدر اسم لون الجميع في ثلاث من أربع قوائم للإسهامات الجوهرية» في نظر 
أربعة خبراء في علم المعلومات. كذلك احتل لون المرتبة الرابعة بين حمسة وعشرين مؤلفا 
يتربعون على القمة من حيث غزارة النشر. وهذا رصيد نقاط قام كوادرا بحسابه اعتتادا 
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على البيانات الوراقية (الببليوجرافية). وفضلا عن ذلك احتل لون مكانا ضمن العشرة 
المتربعين على القمة في القوائم الأربع لأعلى المؤلفين المستشهد بأعم الهم بكثافة في المجال. 
وتؤكد جميع التتائج أن لون يبرز كباحث مرموق في علم المعلومات؛ وخخحصوصا في 
استرجاع المعلومات» بصرف النظر عن طريقة التقييم المستخدمة (كمشورة الخبراء؛ 
وتحليل الكتب الدراسية» وتحليل الاستشهادات المرجعية) (1964 ,61/4078). وإلى لون 
يرجع فضل إدخال الحاسبات في مجالناء كما كانت له الريادة في كثير من تطبيقات تنظيم 
المعلومات واسترجاعهاء فضلاً عن كونه عاملا محفزاً للبحوث التجريبية في هذا المجال. 


كالفن مورز (15155-1919): 

بالمقارنة بتاوبه ولون» جاءت إسهامات كالفن إن. مورز 1400675 .17 ,له في 
تنظيم المعلومات واسترجاعهاء متأخرة كثيرا. فقد كانت مجحالات مورز الدراسية هي 
الرياضيات والفيزياء» إلا أنه كرس قدرا كبيرا من وقته للمعلومات وعلوم الحاسب؛ بعد 
التحاقه بمعهد مساتشوستس للتقنية (ع 127010 [0 عالتااكابآ كااعدبنإعهدوعملال عام 
57 لاستثار وتنمية خبراته في استخدام ا حاسبات (1992 ,00111)). 

وف عام ١15٠‏ سك مورز مصطلح "استرجاع المعلومات' * 211071 «ردرمروة 
[هعة761: الذي ارتبط منذئذ تكاملياء وبسهولة بلغة علم المعلومات”. وكا ذهب 


مورزء فإن استرجاع المعلومات يعني العثور على المعلومات التي لم يستدل على مكاتها 


(*) لقد سك كالقن مورز مصطلح ”استرجاع المعلومات'“ ليستعمل بديلا عن مصطاح ””الوئاقة 
0ع" الذي لم يكن يحظى بإجماع القبول في مجتمع الناطقين بالإنجليزية. وقد فجر سك 
هذا المصطلح موجة الحدل الذي لا يزال مستمرا حول مفهوم المعلومات. (المترجم) 
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أو على وجودها من قبل (1997 ,6417/7614). كذلك يرجع الفضل إلى مورز 1100675 
في اقتراح قانون مورز لنظم استرجاع المعلومات: 
يمكن العزوف عن استخدام نظام استرجاع المعلومات» 
حيث| يكون الحصول على المعلومات بالنسبة للمستفيد أكثر مشقة 
وإزعاجا من عدم الحصول عليها (:ة .2). 
وقد أعيدت صياغة قانون مورز؛ إذ تنص إحدى طبعاته على أنه ”لا يمكن 
استخدام نظام المعلومات إلا عندما يكون عدم استخدامه أكثر إزعاجا من 
استخدامه '* (1987 ,10638). كذلك اقترح جارفيلد (1997) 00717614 نتيجة 
منطقية لقانون مورز: “كلما كانت المعلومات التي يقدمها نظام الاسترجاع صالحة» 
ازدادت احتئالات الإفادة منه“. وقصارى القولء فإن قانون مورز يدل على نحو 
جوهريه على أن النظم التي ترتبط باحتياجات وممارسات من يفيدون منهاء أكثر 
جدارة بالاستشارة عن طيب خاطر (1996 ,112:10©75071). 
وبالإضافة إلى سك مصطلح "استرجاع المعلومات” » ووضع قانون مورز» 
طور مورز نظام ترميز زاتو 222100017718 لفرز عدد كبير من واصفات الوثائق» على 
بطاقة واحدة مثلومة 7101164 خصوصاء وذلك بتركيب 514267171205118 شفرات 
واصفات عشوائية من ثانية أعداد 0065© «10م1 دع 1(ع197:4-41© على هذه 
البطاقات. وكان من الممكن لاستخدام نظام ترميز زاتو أن يسفر عن عندد صغير فقط» 
يمكن التغاضي عنه من الأخطاء 05 2156 ف عملية البحث الوراقي ,0714 0) 
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(1997. كذلك كان مورز مسئولا عن ابتكار تطبيقين موجهين نحو علوم الحاسب» 
وما حساب النصوص وتجميعها (تراك ع«زاتهام) :2ه واتدمء1 إنده1 
© ولغة الحاسب فى إكس إم 1/204. وكان تراك مصمم| على وجه التحديد» 
لمعا حة النصوص غير المنظمة 14115111411164 بطريقة تفاعلية» على عكس طريقة 
الدفعات. أما لغة فى إكس إم 1/104 فكانت تستخدم لنظم الشبكات متعددة 
الحاسبات [1998 76710675011 ,1992 ززط1من)). 

واعترافا بإسهاماته البارزة في مجال علم المعلومات؛ منح مورز جائزة 
الاستحقاق من الجمعية الأمريكية لعلم المعلومات “م زاء501 «نهء 47161 
اسل إن 0نوسلة 6 07111101 عام ١917/8‏ . وتنص شهادة منح الجائزة 
على أنه “قد أثر في مجال المعلوماتء كما أن أفكاره المبكرة تدخل الآن في واقع 
ممارسات اليوم““ (1996 ,767:067507). ولقد كان مورز فعلا أحد الرواد العظام في 
محال تنظيم واسترجاع المعلومات الناشئ. 


جيرارد سالتون (15986-1915197): 

يتفق كل من ينتمي إلى أوساط استرجاع المعلومات» على أن جيرارد سالتون 
01 767670 كان واحدا من الشخصيات المرموقة في المجال؛ فقد كان الرجل 
”المسثول في المقام الأول عن تأسيس مجال استرجاع المعلومات وصموده والاعتراف 
به...'“ بإنفاق ثلاثين عاما من الجزء الأخير من حياته '”يرعاه بعناية» ويسانده عنندما 
يكون المناخ المهني قاسيا أو غير مواتٍ» ويدافع عنه إلى أن يتمكن من من دعم نفسه” 
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(1996 ,.1© © ,علاه6). و إذا ما نظرنا إلى محال استرجاع المعلومات برمته» بوصفه 
بنيانا تعلوه قبة» فإنه يمكن لسالتون أن يكون القبة» بين) يمكن لزملائه؛ ومن يلوذون 
به أن يقوموا مقام الأعمدة أو العناصر الأخرى المساندة للبنيان. 

ولقد كانت أداة سالتون البحثية الرئيسة» نظام معالجة النصوص واسترجاعها 
(سمار ت 7الها51) كدها “زه أودعةجاء« لنجه نجه امالامقاتمم 1116 تمل اترماكتريى 
الذي يعرف أيضا من قبيل التندر بوصفه ”مسترجع سالتون الآلي السحري 
للنخصوص 16221 تزه «ز©« 76171 1/107:1411© [162ع710 52110715 “أ وقد غير ت أفكار 
سالتون طرق معالجة النصوص الكاملة بالحاسب تغيرًا جوهريًاء وأمدت مجال 
استرجاع المعلومات بأسس متينة (1995 ,51011 4014). ”وتشمل إسهامات 
سالتون البحثية» المجال الكامل لاسترجاع المعلومات؛ كأنموذج الفضاء المتجهي 
|1046 © «1610» ووزن المصطلحات» والتلقيم المرتد الخاص بالصلاحية 
أعهطلءء/ ععتنونه 721 و التجميع العنقودي 451671118[ والاستر جاع البو ليني 
الممتدء وقيم تميز المصطلحات..وبناء المعاجم.ء وتبعية المصطلحات 67772/ 
4267146710 وفهم النصوص وتنظيمهاء واسترجاع الفقرات. والمعاللجة الآلية 
للنصوصء باستخدام سمارت :5111411 بالطبع ” (1996 ,.آت آ© ,اأعلاه07)). ويمكن 
لكل واحد من هذه الإسهامات أن يكون ولاشك» موضوعا لمناقشات مستفيضة» 
كا يحظى بعضها با مناقشة في أجزاء أخرى من هذا الكتاب. إلا أنه ليس من قبيل 
المبالغة القول بأن سالتون قد أدخل علوم الحاسٌء والأساليب المعاصرة إلى مجال 
استرجاع المعلومات. 
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وكانت نظم استرجاع المعلومات التي تعمل على نطاق تجاري» في ستينيات 
القرن العشرين» تستخدم في الأساس المنطق البوليني» وتقنيات استرجاع ما قبل 
سمارت الأخرى. وتطبق اليوم العشرات من النظم التجارية الشهيرة الأفكار 
والتقنيات التي تطورت في سسرارت. فقد حصلت اتديفيديوال 110110121 (وهي 
خدمة مقتطفات إخبارية جديدة) على سبيل المثال» على ترخيص استخدام تقنيات 
سمارت مباشرة. وتعد نظم أخرى مثل ندل المعلومات واسعة المدى 2 مر 1 
567675 172/01711011011 (و يز 7/415)» وداوكويست :100117701251 وهي إحدى 
أدوات الشبكة الإخبارية لداو جونز »وه /! و10 82010 تقنيات مشتقة من 
سمارت باقر وقد ترقت نط ججا رازه براك مر اليقدف: ومن بينها 
(ون) 1717 وهو نظام استرجاع قانوني» تديره شركة وست للنشر 11/654 
اانه صمي 111:18ى ةاطلاظ» وانكوايري انال الل وهي أداة بحث مرموقة أخرى 
(1995 ,510611 4014). وهناك أساليب استرجاع معلوماتء لم يتم اختبارها إلا في 
سيارت» وتطك الآن يرجه عا جاسى لق الخروقك عات قتع اتترجاء الدلومتاكه 
كنظم استرجاع الإنترنت. 

وتبدي كل هذه النظم التأثر بمفاهيم سالتون وبحوثه في استرجاع المعلومات» 
كما تطبق هذه المفاهيم والبحوث في البيئات الإلكترونية والرقمية. وفضلا عن ذلك 
كان سالتون مؤلفا غزير الإنتاج؛ فقد نشر خمسة كتب حول استرجاع المعلومات» 
وأكثر من ١5١‏ مقالة بحثية في المجال» طوال خياته المهنية والوظيفية ,510611 014 4) 
(1995. كذلك كرمن سالتون جهوده البارزة للمجال» وحصل في مقابل ذلك على 


جوائز عذدة. 
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أخبت كارن سبارك جونز 307:65 5787 076 دراستها في المرحلة الجامعية 
الأولى في التاريخ أولاء ثم في الفلسفة بعد ذلكء بجامعة كمبردج بالمملكة المتحدة 
10.16 ,6ع ة«طنجيمن) “زه «!ةىرء:ة:27]. وكانت دراستها للفلسفة هي التي قادتها لمجال 
استرجاع المعلومات» وعلى وجه اللخصوص ما يسمى الآن معالجة اللغة الطبيعية 
(.271). وفي رسالتها للدكتوراه عام 2١1475‏ بعنوان "المترادفات والتصنيف الدلالي “» 
استخدمت نظرية الكتل 61:17:75 لتجميع عناقيد المصطلحات (2007 ,15اة/18). 


ولقد قدمت سبارك جونز بعملها في استرجاع المعلومات لأكثر من أربعة 
عقود» إسهامات جوهرية» في مجحالات عدة» ى| أثرت في كثير من المحيطين بهاء من 
الزملاء والطلبة على السواء. ومن الناحية الزمنية» كان النهج التعجريبي لاسترجاع 
المعلومات. أول هذه المجالات. وفي غضون السنوات النهائية لبحوث سبارك جونز 
للدكتوراه» كانت تجارب كرانفيلد الملحمية قد دخلت مرحلتها الثانية» وبدأت سبارك 
جونز تبدي اهتماما قوياء لا بالنهج التجريبي الذي سلكته دراسات كرانفيلد فحسب» 
وإنها ندقائق الطر ق والأدوات التجريبية أيضا (2008 11ه1 يل :ه15 1]0). ثم 
استخدمت سبارك جونز بعد ذلك مجموعة كرانفيلد في إجراء تجارب لاختبار 
التجمعات العنقودية للمصطلحات. لأغراض التصنيف الدلالي» تلك التجمعات 
التي بدأت تستكشفها في بحثها للدكتوراه. 

غير أن بحوث سبارك التجريبية في استرجاع المعلومات» لم تتوقف عنما انتتهت 
تجارب كرانفيلد عام /1471» وإنه| قادت جهدا مشتركا للباحثين المقيمين في المملكة المتحدة» 
في سبعينيات القرن العشرينء لتنمية مجموعة تجريبية جديدة '”مثالية “: بحيث يصبح من 
الممكن إجراء التجارب» خارج حدود مشروع تجريبي واحد كتجارب كرانفيلد. 
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وعلى الرغم من أن هذا الجهد لم يؤت ثاره؛ نظرا لشح الدعم الماللي المتوافر في المملكة 
المتحدة» فإنها واصلت العمل الشاق»؛ دون كلل في هذا المجال. وقد قامت سبارك 
جونز بتحرير ”تجار ب استرجاع ا معلوفات'* ‏ [هنعةجاء !1 11:/077712110 
([198 ,كعضامل علقم 3) 17111 ووردل الكتاب أحادي المو ضوع :[ 7710110810 
الوحيد المكرس في المقام الأول» للطرق التجريبية في استرجاع المعلومات» كما كتبت 
أيضا بحثين في ذلك الكتاب. ومن ناحية أخرىء عندما بدأت سلسلة مؤتمرات 
استرجاع النصو ص تر ك 1180 معدم سدم أهنء 11 :د12 عام 219197 
العامة يرم التجريبية المثالية» التي كانت هي وزملاؤها عاجزين 
عن تكوينها قبل عقدين تقريبا. ومنذ البداية؛ شاركت سبازك جونز» ببحماس في 

سلسلة ترك 110180» بوظائف أو مهام متعددة (كمستشار غير رسمي للمنظمين» 
وعضو لحنة البرنامج» وعضو مشارك بفريق البحث). والأهم من ذلكء قامت 
سبارك جونز بكتابة سلسلة من البحوث؛ تلخص وتقارن أداء مخحتلف الفرق المشاركة 
في تجارب ترك 77880. كذلك سجلت تأملاتها حول الدروس التي يمكن لمجتمع 
استرجاع المعلومات استخلاصها من العدد الحائل من النتائج المتباينة» التي انتهى إليها 
ا مشا ركون في ترك (2000 ,1995 ,65م اء7قم5). ولم يكن هناك من أحد يبدو 
أكثر كفاءة من سبارك جونزء للنهوض بهذه المهمة بالغة الأهمية؛ نظرا.لاهتمامها طوال 
حياتها بالنهج التجريبي في استرجاع المعلومات. والتزامها تجاه هذا النهج. 

ويمثل البحث الذي نشرته سبارك جونز عام 37 عن التردد العكسي 
للوثائق 107 تم :«علاوع زر 7::111لهه00 عىعلاة» مجالا آخر لبحوثهاء وهو مجال الطرق 
الإحصائية في استرجاع المعلومات (1972 ,301:65 528:71). وقد شرحت في ذلك 


البحثء الذي لا يزال على قمة البحوث المستشهد بها في المجال» كيف يمكن لوثيقة ما 
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أن تكون صالحة؛ لا لأن الكليات المفتاحية تتردد بكثافة مها فحسبء وإنما لأن تلك 
المصطلحات لا تتردد بكثافة في الوثائق الأخرى غير الصالحة أيضا. وبالارتباط 
بخوارزمية تردد المصطلحات (17) (41/67:6// 0467771 التي طورتها مجموعة سالتون» 
بجامعة كورنل ((اأعرع اط ملآ [أعدجره0)» أصبح الجمع بين التردد العكسي للوثائق /4:» 
وتردد المصطلحات, أكثر طرق وزت البديل الاحتياطي 4/2014 استخداما لسنوات 
طويلة. وقد أفضى معيار التردد العكسي للوثائق /44» فيا بعد إلى وزن الصلاحية في 
الأنموذج الاحتمإلي الذي طوره روب رتصون بالتعاون مع سبارك جونز 0507ءطه18) 
(1976 ,70:65 52871 . وعلى نحو ماء يشكل جهد سبارك جونز في التردد 
العكسي للوثائق؛ مصدر إلهام لسلسلة من الدراسات التجريبية متينة الأساس لوزن 
' المصطلحات. وقد أثبتت الطرق الإحصائية» ممثلة في التردد العكسي للوثائق» وغيره 
من المقاييس ذات الطابع الماثل» أنها ليست باهظة التكلفة» | أنها تنافسية أيضا في 
استرجاع المعلومات. ومن الممكن الاطلاع على أحدث شاهد على ذلك في سلسلة 
تر ك (1[995 ,وعدمق عاء«قوكى). 

وبامتداد بحوثها حول الطرق الإحصائية في استرجاع المعلومات. إلى مجال أكبر 
مختلف, ولكنه وثيق الصلة؛ بدأت سبارك جونز البحث في ثانينيات القرن العشرين؛ 
في معالجة اللغة الطبيعية» مع التركيز» بوجه خاص على التلخيص الآلي» والرد على 
الاستفسارات» و قمر باللغة الطبيعية. وكان لديها اعتقاد جازم بأن "الكلمات 
قائمة في حد ذاتها فقط " (2007 ,1777:1/5)» وكانت ترى من العجب أن يتم تمثيل 


النصوص باستعمال لغات (كرؤوس الموضوعات مثلا) بخلاف اللغة الطبيعية 
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(1994 ,7065 آ50876). وقد أكسبتها بحوثها حول معالجة اللغة الطبيعية آل[ 
مثل: (2007 ,2005 001:65 :8761م5) في النهاية شهرة كبيرة في ذلك المجال على 
الأقل» كا في المجالات الأخرى. على الرغم من أن معالجحة اللغة الطبيعية تختلف عن 
المجالات الأخرى بالمقارنة. ونظرا لإسهام سبارك جونز الهم في معالجة اللغة 
الطبيعية» نشر تكريا لها كتاب بعنوان “رسم خريطة مسار جديد؛ معالجة اللغة 
الطبيعية واسترجاع المعلو مات مو مناعابما لمسععاة تعسريره0) مولز ه و0111 
(2005 211 1) اودع اماع11 0101 20|171017ظ 24 ع1أودءءع270. وهذا ليس الكتاب 
الوحيد.الذي يبرز إسهامها وتأثيرها في معالجة اللغة الطبيعية. والواقع أنها بالإضافة 
إلى الكثير من الكتب الأخرى التي قامت بتأليفهاء اشتركت في تحرير كتاب في معالجة 


اللغة الطبيعية في عام 985 ١‏ (986[ ,#عططء/ل! عي 0165ل عل «قمد ,:06705).. 


وكانت بحوث سبارك جونز في السنوات التالية» تشمل استرجاع الوثائق 
الناطقة. وبالاشتراك مع زملائهاء كتبت بحثين حصلا على جوائز» تقديرا لعملهم 
الابتكاري حول هذا ا موضوع (2005 ,«#هاطنزه14). وكانت الخوارزميات المحكمة 
غير المقيدة للكلمات المفتاحية» وأساليب استرجاع المعلومات المعتمدة على النصوصن 
المعدلة القائمة» من بين البحوث التي قامت سبارك جونز بإجرائها حول البيانات 


الصوتية» كالأحاديث ونشرات الأخبار الإذاعية. 


لقد أفاد محال استرجاع المعلومات كثيرا من جهود سبارك جونز في طريقة 


التردد العكسي للوثائق في وزن الوثائق» ومعالجة اللغة الطبيعية» واسترجاع الوثائق 
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الناطقة. والمنهج التجريبى قِ استرجاع ا معلومات (2007 ,مكدع 10 عع 1ء171/111). 
وسوف يظل تأثيرها في مجتمع استرجاع المعلومات» كباحثء ومعلم» ومستشار» 


ملموسا لستوات طويلة: 


نظرة تفصيلية في المفاهيم الأساس: 


يتضمن عنوان هذا الكتاب أربعة مفاهيم رئيسة؛ هي المعلومات وتنظيم 
المعلومات» واسترجاع المعلومات» والعصر الرقمي. ولكل هذه المفاهيم بلا استثناء 
مرادفات» ومن الممكن تأويلها وفهمها على أكثر من نحو واحد. في السياقات 
المختلفة. وقد قصد بالمناقشة التالية شرح معاني ومضامين المفاهيم الواردة في هذا 
الكتاب وبيانها. 


المعلومات: 

لقد حظيت المعلومات كمفهوم بالنظرء وقورنت بمصطلحات كالبيانات» 
والمعرفة» والحكمة» بكثافة (ى! في 1992 ,11664010 على سبيل المثال)» ومن ثم فإنه لا 
تبدو هناك حاجة بالنسبة لهذا الكتاب,؛ لأن يكرر أو يستطرد في تلك المناقشات 
والمناظرات. ومن ناحية أخرىء فإن الكلهات ”المعلومات" » و”النصوص”. 
و”الوثائق”'“غالباً ما تستعمل تبادلياً في المجال (مشل ”استرجاع النصوص“» 
و“تنظيم الوثائق). ووفقالما ذهب إليه لارسن (1999) 67ىنصط: 


(*) نضيف هنا أن كارن سبارك جونز شاركت أيضا ف تأليف كتاب .حول علاقة علم اللغة بعلم المعلومات: 
,602001آ .5012766 121012131101 320 5165 أناعداناآ .لإقك1 للقة31 2 5عمه0ل ءاءتقم5 ومععدكا 
.3 رؤوع؟2 أ 1مرعل2عث (المترجم) 
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فإن الوثائق» في مجالناء تتسم بأن لها “سعرا'» ويمكن أن 
تحصى ”عددا» وهي على هذا النحو المكونات الأساس 
لإحصاءات المكتبات. كا أن معظمها '”يشغل حيزا''» ىا يمكن 
أن "تمو تيه لليذارل" 5 نانيك أوعلل ا اعمس ار 
تبل بمضي الوقت (1020 .5). 
وبالإضافة إلى تعريف لارسنء يمكن للوثائق أن تشمل الوسائط المتعددة. وإذا . 
كانت النصوص تعني المعلومات النصية دون سواهاء فإن ”الوثائق' يمكن أن تشمل 
معلومات الوسائط المتعددة (بمعنى أي تجميع من المعلومات الصوتية والبصرية 
والصورء فضلا عن المعلومات النصية). ويبدو أن ”المعلومات'“ تشمل كلا من 
النصوص والوثائق؛ أي إن مضمونها هو الأوسع بين المفاهيم الثلاثة. 
وقد أجريت في السنوات الأخيرة بحوث حول استرجاع الفقرات. في مقابل 
استرجاع الوثائق (2000 ,707:65 76م5). ويدل ”استرجاع الفقرات'“ (الذي 
يسمى أيضا استرجاع المعلومات) على العثور على المعلومات, أو الفقرات من الوثائق 
على وجه التحديد (كفقرات أو قطاعات من الوثائق بأطوال متفاوتة) التي يحتاج 
المستفيد إليها. أما ”استرجاع الوثائق'» في مقابل ذلك فيعني الحصول على الوثيقة 
كاملة للمستفيد النهائي» حتى وإن كانت حاجته تقتصر على فقرة موجزة. وإذا ما 
نظرنا إلى كلمة “المعلومات”“ بوصفها مرادفا ”للفقرات" » كما في “استرجاع 
الفقرات”' ' فإنه ينبغي أن يكون هناك استثناء» بالنسبة للمناقشة قشة السابقة» فيا يتعلق 
بمضامين ”المعلومات ". 
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تنظيم المعلومات: 

أيا كان الشكل الذي يمكن أن يتخذه عنصر المعلومات» فإنه بحاجة لأن يتم 
تنظيمه لكي يكون من الممكن استرجاعه. ويشمل تنظيم المعلومات اقتطاف بعض 
العناصر (كالقلات الماح أ الغازاف عل سيل المخال») سو الوقناتي وكين 
مصطلحات (كالواصفات أو رؤوس الموضوعات على سبيل المثال) للوثائق» بحيث 
يكون من الممكن تحديذ معالم مضمونهاء أي تمثيلها. وعادة ما يكون من الممكن تنظيم 
المعلومات عن طريق أي تجمع من الوسائل التالية: الاستخلاصء والتكشيف. 
والتصنيفء والتلخيصء والاقتطاف. وعلى الرغم من اختلاف معاني “معالجة 
المعلومات و”إدارة المعلومات" فإنه غالبا ما ينظر إليهما بوصفهما مرادفين '”لتنظيم 
المعلومات"". وبينا يدل مصطلح ““معالجة المعلومات' على كيفية معاملة المعلومات 
لأغراض الاسترجاعء فإن مصطالح ””إدارة المعلومات'' يتعلق بكامل الأنشطة 
المرتبطة بالمعلومات» من التقاط المعلومات حتى تنظيم المعلومات. 

ويستعمل مصطالح “تنظيم المعلومات" في هذا الكتاب. لتغطية مختلف 
الجوانب والطرق الخاصة بإعداد البدائل 65 أو التمثيلات (كالكشافات 
والمستخلصات مثلا) لأغراض استرجاع المعلومات. 


استرجاع المغلومات: 
لقد حظي استرجاع المعلومات بالمعالجة: بطريقة أو أخرىء بوصفه مجالا 


موضوعياء يغطى كلا من جانبى تنظيم المعلومات واسترجاعها ع 7:65م1 عل 87م5) 
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(1997 17:/161. كذلك يشار إلى الجانب الخاص بالاسترجاع بوصفه أيضا ””الوصول 
إلى المعلومات 26655 371/077114110"' و“التاس المعلومات عاتتاع52 111071 1مرم وز '“ 
و”“البحث عن المعلومات #:11(ء560 1/07:01101"'. ومن الممكن النظر إلى هذه 
المصطلحات بوصفها مرادفات ” للاسترجاع”""» إلا أن لكل منها توجهه الخناص فيا 
يتعلق بالمضامين؛ فمصطلح '”الوصول إلى المعلومات”' يركز على الجانب الخاص 
بتحصيل المعلومات أو الحصول عليها. وفى مقابل ذلك يركز “التهاس المعلومات” على 
المستفيد المشارك على نحو إيجابي في العملية. أما فيا يتعلق ' بالبحث عن المعلومات'' فإن 
تركيز الاهتمام يبدو منصبا على كيفية البحث عن المعلومات. 

وبالإضافة إلى المصطلحات التي سبق ذكرهاء فإن “التنقيب عنن البيانات 
8 0614“ و “اكتشاف المصادر 425006 مع#لامى6/““» غالبا ما نجدهما في لغة 
اختصاصيي المعلومات. في السنوات الأخيرة» عند مناقشة استرجاع المعلومات. 
وعادة ما يستتخدم كلا المصطلحين في إدارة الأعمال وبيئة المشابكة. ولازلنا الآن في 
انتظار ما إذا كان من الممكن لكل من " التنقيب عن البيانات” و اكتشاف المصادر” 
أن يتم استيعابها في اللغة المألوفة لمن ينتمون إلى مجال استرجاع المعلومات. 

وهناك طبقة دلالية أخرى في استرجاع المعلومات» وهي ””اختزان المعلومات 
166 1011ل موري ل الذي يتناول في المقام الأول» تسجيل المعلومات 
واختزانهاء إلا أن هذا الاستعمال في سبيله لأن يصبح تدريجياً من ممارسات الماضي؛ 
نظرا لأن ”اختزان المعلومات'“ لم يعد يشكل هما ذا بال» وذلك بفضل التطورات التي 
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حدثت في تقنيات اختزان المعلومات والوصول إليها. ولمذاء فإن استرجاع 
المعلومات» في هذا الكتاب» يشمل السعي وراء المعلومات. أو التماس المعلومات» 
والبحث عن المعلومات» والوصول إلى المعلومات. إلا أنه يستبعد اختزان المعلومات. 


العصر الرقمي: 

لكلمة “رقمي 0161/41“ مقارنة بكلمة “تناظري 876108“ مفهوم حديث 
نسبيا؛ فكل من ”رقمي“ و”تناظري“ مصطلحان يتصلان بالتقنيات الإلكترونية» 
وفقا للتقرير التالي الذي قدمته تك تارجت (2001) 1047861 [160» وهي شركة 


تعرّف أيضا بالمصطلحات في تقنيات المعلومات: 


يدل رقمي على التقنيات الإلكترونية التي تولٌّد وتختزن 
وتعالج أو تجهز البيانات في حالتين: إيجابية وغير إيجابية. ويتم 
التعبير عن الإيجابية أو تمثيلها بالعدد »)١(‏ بين) يتم التعبير عن غير 
الإيجابية أو تمثيلها بالعدد (صفر). ومن ثمء فإن البيانات التي يتم 
نقلها أو اختزانها بالتقنيات الرقمية» يتم التعبير عنها كسلسلة من 
الأصفار والآحاد ... وفيا قبل التقنيات الرقمية» كان النتقل 
الإلكتروني يقتصر على التقنيات التناظرية» التي تنقل البيانات في 
شكل إشارات إلكترونية متفاوتة التردد أو النطاق» تضاف إلى 
موجات حامل تردد معين. وكانت الإذاعة والنقل المهاتفي 


تتعتملان تقلديا نقدة تناظوية 
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ومع ظهور الحاسبات والإنترنت وتقنيات المعلومات الأخرى. بدأنا ندخل 
بجلاء؛ العصر الرقمي. وهناك تزايد في مختلف الأنشطة؛ التي تشمل البحث 
والتطوير المتصلة بتنظيم المعلومات واسترجاعهاء التي تتم في البيئة الرقمية. ومن ثم 
فإن هذا الا للدي عتر نامعل ذلنك رمس الو شع التزاه التعرفة 
بالنسبة للمجال. 


الكونات الرسسة: 

من الممكن تقسيم تنظيم المعلومات واسترجاعها برمته؛ إلى عدة عناصر رئيسة: 
وهي مراصد البيانات» وتقنيات البحثء واللغة» وواجهة التعامل. والبشر (بمن فيهم 
المستفيد» واختصاصي المعلومات؛ ومسئول تطوير النظم)» والمعلومات» والنظم, . 
. عناصر ثلاثة مترابطة» تعمل معا في قطاع تنظيم المعلومات واسترجاعهاء على الرغم 
من أنها لا تحظى بالمناقشة على وجه التحديد في هذا القسم. 
مراصد البيانات: 

تشكل مراصد البيانات أو قواعد البيانات 461454565. في تنظيم المعلومات 
واسترجاعهاء المعلومات التي يتم التعبير عنها أو تمثيلها وتنظيمها بطريقة معينة. 
وبالمعنى التقليدي يتكون مرصد البيانات (كمرصد البيانات على الخط المباشر على 
سبيل المثال) عادة من تسجيلات 5600745) يتم تقسيمها إلى حقول 7145 وهي 
أصغر الوحدات وأقربها للطبيعة: بالنسبة لفرز المعلومات والبحمث عنها 
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واسترجاعها؛ ففي مرصد بيانات مقالات الدوريات». على سبيل المثال» يشكل المؤلف 
والعنوان حقلين. وتتكون مراصد البيانات التقليدية من قسمين؛ "الملفات التسلسلية 
لعةاسعيروءى "" و“الملفات المصنفة أو المقلوبة 7165 0067124 “. والملشف 
التسلسلي هو مصدر مرصد البيانات؛ إذ ينشتمل على المعلومات منظمة في بنيان 
المرصدء القائم على الحقل والتسجيلة. ويسمى بالملف التسلسلي لأن ما يشتمل عليه 
من تسجيلات. ترد مرتبة وفقا للنسلسل الذي تتخذه عند إدخاها في مرصد البيانات, 
أما الملف المصئف أو المقلوب» ويعرف أيضا بالكشافء فيكفل الوصول إلى المللف 
التسلسلي» بناء على استفسارات بحث معينة. ويسمى بالملف المقلوب نظراً لأن 
الترتيب الذي يتم به تمثيل المعلومات (نقطة الوصول 0111م 000255 أولا ومحدد 
المكان ثانيا) عكس الترتيب في الملف التسلسلي (حيث محدد المكان 07/هع0/ أولا 
ونقطة الوصول ثانيا). 

وبالمعنى غير التقليدي؛ يمكن لمرصد البيانات (كما في نظم استرجاع الإنترنت 
على سبيل المثال) أن تكون به ملفات تسلسلية وملفات مقلوبة. إلا أن تكوين المللف 
التسلسلي لنظام استرجاع الإنترنت» على سبيل المشال؛ يختلف عم يناظره في النظم 
التقليدية لاسترجاع المعلومات (كنظم الخط المباشر مثلا)؛ إذ لا يتخذ تكوين الملف 
التسلسلي شكل مرصد البيانات القائم على الحقل والتسجيلة؛ حيث يتكون هذا الملف 
من معلومات بلا حقول» يتم التعبير عنها بصيغ أشبه بالنثر 57056/1/:6. يضاف إلى 
ذلك أن المعلومات المتضمنة في هذا الملف. ليست بدائل (كالمستخلصات مثلا) وإنما 


أجزاء من المحتوى الكامل لإحدى وثائق الإنترنت الأصلية (كصفحة العنكبوتية 
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6 على سبيل المثال). إلا أنه في النظم التقليدية لاسترجاع المعلومات» عادة ما 
تكون المعلومات في الملفات التسلسلية ضريا من التمثيل في شكل توصيفات وراقية» 
ومستخلصات» وملخصاتء ومقتطفات» وما شابه ذلك. 

ويحدد محتوى مرصد البيانات وتغطيته» ما يمكن أن يتم استرجاعه فيا بعد 
من نظام استرجاع المعلومات. 
تقنية البحث: 

لا يمكن البحث عن المعلومات التي يتم تمثيلها وتنظيمها نسقيا في مرصد 
البيانات» واسترجاعها إلا عندما تتوافر تقنية بحث مناظرة. ويمكن لتقنية البحث أن 
تكون على أي درجة من التطور, من حيث قدرات البحثء التي تتحدد معالمها في النهاية» 
كخوارزميات البحثء والإجراءات التي ينطوي عليها نظام استرجاع المعلومات. ومن 
الممكن لجميع إجراءات البحثء أن تصنف بوصفها أساسية أو متطورة. وعادة ما نجد 
إجراءات البحث الأساسية في معظم نظم استرجاع المعلومات العاملة؛ بين) يتم اختبار 
إجراءات البحث المتطورة» وإجراء التجارب عليها في المختبرات» أو نماذج التنظيم الأولية 
مهجم في المقام الأول. إلا أنه يتزايد في السنوات الأخيرة ربط خوارزميات البحث 
المتطورة تكامليا بنظم استرجاع الإنترنت. 

وتنتمي الإجراءات» كالبحث بالكلمات المفتاحية» والبحث البوليني» والبتر 
01 والبحث بالتقارب 57017115 , لمنظومة خوارزميات البحث 


الأساسية. وكا سبق أن أشرناء فإنه غالبا ما تشكل هذه الإجراءات تقنيات البحث 
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الكامنة في كثير من نظم استرجاع المعلومات. ومن الممكن للمستفيدين النهائيين من 
محدودي التدريب وخبرات البحثء أن يكونوا قاذرين على إنجاز مهام البحث 
البسيطة؛ في بيئات الاسترجاع من هذا الضرب. وتستخدم تقنيات البحث المتطورة» 
كالبحث بالوزن؛ في غالب الأحيان في نظم الاسترجاع الأحدث. التي يتم تصميمها 
بوجه عام لأولئك الحاصلين على تدريب مهنيء المتمرسين في البحث. 

وتحدد قدرات تقنية البحثء ما يمكن أنه يتاح من أساليب الاسترجاع 


للمستفيدين» وكيف يمكن استرجاع المعلومات المختزنة في مراصد البيانات. 
اللغة: 


تعتمد المعلومات على اللغة» المنطوقة أو المكتوبة» عندما يتم تجهيزهاء أو نقلها 
أو التواصل بها. واللغة في هذا السياق أحد المكونات الجوهرية في تنظيم المعلومات 
واسترجاعها. ومن الممكن للغة في تنظيم المعلومات واسترجاعهاء أن تكون لغة 
طبيعية أو لغة مقننة 70/127 60111701164. ويسمى ما يستعمله البشر على نحو 
طبيعي للتعبير عن المعلومات أو صياغة الاستفسارات» ”لغة طبيعية [1:2©:: 
#6 . وإذا ما استخدمت لغة اصطناعية» محدودة المفردات» والنظم 5 
والدلالة» والسياقاتء في التعبير عن المعلومات واسترجاعهاء فإن تلك اللغة تسمى 
“اللغة المقيدة (هالاطهءه 4ء1[اممزمم '“ (995[ ,آء:ذ[اء”11). وهناك ثلاثة أشكال 
مألوفة للغة المقيدة» وهي خطط التصنيف» وقوائم رؤوس الموضوعات. والمكانز 
514+ ولكل منها وجه الاستخدام المخقاص بهاء في تنظيم المعلومات 
واسترجاعها. 
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وتكفل اللغة الطبيعية» بوجه عامء أعلى درجات التخصيص والمرونة في تنظيم 
المعلومات واسترجاعها. ولا يحتاج الإنسان إلى أي تدريب أو تمرين في استخدام اللغة 
الطبيعية؛ لأنبا هي اللغة التي نستخدمها للتواصل الشفوي أو التحريري يؤميا. وفي 
مقابل ذلكء فإن ابتكار اللغة المقيدة وصيانتها أمر باهظ التكلفة» كاأته يتعين على 
المرء أن يتعلم كيف يستخدم مثل هذه اللغة بالممارسة والتدريب. إلا أنه بإمكان اللغة 
المقيدة الحد من المشكلات الجوهرية 37/3512 المرتبطة باللغة (كالتعقد,. والفروق 
الدقيقة 51/511671655» والغموض) عند استعمال اللغة الطبيعية لأغراض تنظيم 
ا معلومات واسترجاعها (1994 ,0776704 :4 254616:ه]). ولقد كان الجدل في هذا 
لمجال حول اللغة الطبيعية في مقابل اللغة المقيدة» محتدما منذ خباية القرن العشرين 
(1994 ,إءاساه8) إلا أن اللغة تظل عنصرا جوهريا في تنظيم المعلومات 
واسترجاعهاء أيا كان ما ينتهي إليه الجدل. 

فاللغة» إلى حد ماء تحدد مدى المرونة والاصطناعية في تنظيم المعلومات 
واسترجاعها. والفصل الرابع في هذا الكتاب مكرس لناقشة اللغة في تنظيم المعلومات 


واسترجاعها. 


واجهة التعامل: 

واجهة التعامل ©11167/22» ى| ذهب شو (1991) ©:/3. هى مأ يرأه المستفيدء. 
ويسمعه. ويلمسه عند التعامل مع نظام الحاسب. وتدل واجهة التعاملء في تنظيم 
' المعلومات واسترجاعهاء على التفاعل الذي يتم بين المستفيد والأنشطة المنصلة به. 
ومع هذا المكون في تنظيم المعلومات واسترجاعها أيضاء يبدو ما يتصل بالمستفيد 
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واضحاء وإن كان متداخلا مع المكونات الثلاثة الأخرى» وهي مرصهد البيانات» 
وتقنية البحث» واللغة. 


ودائما ما ينظر في واجهة التعامل عند الحكم ما إذا كان نظام معالجة المعلومات 
واسترجاعها متعاطفا مغ المستفيد (716:01/-14567. وى| تم تعريفها في قانون مورزء 
فإن النظم المتعاطفة مع المستفيد» من شأنها أن تجتذب أعدادا من البشر أكثر تما تجتذب 
النظم المعادية للمستفيد 567-11051116 من حيث الاستخدام. وتتحدد جودة واجهة 
التعامل بطريقة التفاعل (كالاختيار من قائمة الخيارات 77670 فعلا) وخصائضن 
العرض (كإخراج الشاشة وشكل الحرف مثلا) والعوامل المتصلة الأخرى. وقدبداً 
استغلال التقنيات التكيفية والمؤثرة» في تصميم واجهات التعامل وتنفيذهاء حيث 
يتجه المزيد من الاهتمام نحو البعد الإنساني في تنظيم المعلومات واسترجاعها. 
وتتككو :واه الامل فى الجناح الهنائي للنظام بالعدية لتظلي المعلرمات 
واسترجاعهاء وخصوصا إذا ما كان النظام يعمل في البيئة الرقمية. 

وقصارى القول؛ فإن مرصد البيانات» وتقنية البحث. واللغة» وواجهة 
التعامل تشكل المكونات الأساس لتنظيم المعلومات واسترجاعهاء على النحو الذي 
يتفاعل مع البعد الإنبساني» في مرحلة أو أخرىء أثناء عملية تنظيم المعلومات 
واستر جاعها. 


المشكلق الجوهريت في تنظيم المعلومات واسترجاعها: 
لا تزال المشكلة الجوهرية في تنظيم المعلومات واسترجاعهاء هي كيف يمكن 


الحصول على المعلومات المناسبة للمستفيد المناسب. في الوقت المناسبء على الرغم 
من وجود متغيرات أخرى (كخصائص المستفيدين أو حدود تغطية مراصد البيانات 
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مثلا) في بيئة تنظيم المعلومات واسترجاعها. وقبل الاستطراد في استكشاف المشكلة 
الجوهرية» ينبغي النظر أولا في عملية تنظيم المعلومات واسترجاعها. 


عملية تنظيم المعلومات واسترجاعها: 

في عملية تنظيم المعلومات واسترجاعهاء يشرع المستفيد في عملية البحث» 
ويتلقى أي نتائج يتم استرجاعهاء بين) يعد اختصاصي المعلومات مسئولا عن تصميم 
نظم استرجاع المعلومات وتنفيذها وصيانتها. ويوضح الشكل رقم ١/١‏ عملية تنظيم 
المعلومات واسترجاعها. ظ 

وينبغي لأي:'معلومات يتم استرجاعها من مرصد البيانات» أن يتم تمثيلها أو 
التعبير عنها أولا من جانب اختصاصي المعلومات» وفقا للغة التي وقع عليها الاختيار 
لأغراض تنظيم المعلومات واسترجاعها. ومن الممكن أن تحدث بعض مظاهر 
التفاوت في أثناء التعبير عن المعلومات؛ ومن الممكن أن تكون هناك مشكلات 
عويصة: إذا ما استخدمت لغة مقيدة» وذلك للأسباب التالية: أولاء عندما يتم التعبير 
عن المعلومات المسجلة في أوعية كمقالات الدوريات أو التقارير التقنية» في شكل 
مستخلصات أو مصطلحات كشفية» وما شابه ذلكء. فإن استعادة المعلومات الأصلية 
لطبيعتهاء لا تبدو قابلة للتحقيق. ويمكن القول جدلا بأننا نمثل» على سبيل المثال» 
دائرة كبيرة بدائرة صغيرة» فإذا حدث ذلك,. فإن بعد الحجم يكون قد تم تشويهه. 
ثانياء إن أي لغة مقيدة مجرد مجموعة فرعية من اللغة الطبيعية التي كتبت بها الوثائق 


الأصلية؛ ولهذا فإنه غالبا ما يكون من الصعب أن نجد, على سبيل المثال» تطابقا تاما 
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أو مضاهاة دقيقة بين مصطلح في وثيقة ماء وواصفة مستقاة من مكنز ما. ولأغراض 
التمثيل أو التنظيم فإنه يمكن للمكشف حيئئذ أن يختار من المصطلحات المتصلة» 
تلك المصطلحات الأضيق أو الأكثر اتساعاء الواردة في المكنز. ثالئاء يبدو عدم 
الاطراد في التعبير عن المعلومات (بما في ذلك تحليل المفاهيم) أمرا لا مفر منه. 
وخصوصا إذا كان هناك أكثر من شخصء أو أكثر من نظام يعالج المهمة. وقد سجل 
كلفردون (1984) :0166740 أنه حتى وإن كان هناك مكشفان متمرسان.» 
يستخدمان اللغة المقيدة نفسهاء فإنبه| يمكن أن يتفقا معا على تخصيص "١‏ بالمئة فقط 
من المصطلحات للوثيقة نفسها. وعلى النحو نفسه. تبين لهمفري [(©1[تز:111/7 
(1992). أن الاطراد فيا بين المكشفين في المدلاين :441:01.177: في اختيار 
المتطلضاة من قائمة رؤوس الموضوعات الطبية 101125 أ ء[طلا5 أمء :110 


(146511)» كان أقل من 54 بالمئة. 


ومن ناحية أخرى؛ يطلب من المستفيدين تحويل احتياجاتهم المعلوماتية» 
باستخدام لغة تنظيم المعلومات واسترجاعها التي يقع عليها الاختيار إلى 
استفسارات يمكن بعدئذ تنفيذها في مرصد البيانات» بتقنية البحث المتوافرة. ولقد 
كان الباحثون منذ زمن بعيد, على دراية بالتعقد الذي يكتنف هذه المهمة؛ فقد أشار 
بلير ومارون (1985) :1/1707 27:4 81417 على سبيل ال مثال؛ إلى '”أنه من الصعب إلى 
حد الاستحالة بالنسبة للمستفيدين» أن يتكهنوا بالكليات وتجميعات الكلمات» 
والعبارات التي تستعمل من جانب جميع (أو معظم) الوثائق '' (295 .5). 


18 





الشكل رقم ١ /١‏ عملية تنظيم المعلومات واسترجاعها 


يضاف إلى ما سبق أن أي استعمال للغات المقيدة» ومقومات البحث 
(كالمعاملات البولينية مثلا) من شأنه أن يضاعف الصعوبة. والبحث في اللغة 
الطبيعية» أي البحث بالعبارات أو الجمل الكاملة» | تستعمل في التواصل اليومي» 
دون صياغة أي استفسارات مقننة كالما السماء زرقاء؟ مثلا) في سبيله لأن يكون 
متاحا على الإنترنتء إلا أنه لا يزال هناك طريق طويل ينبغي أن يقطعء لكي يحقق 
الباحثون في معالجة اللغة الطبيعية» أحد أفرع الذكاء الاصطناعي (47) اختراقات 

وبعبارة أخرىء فإن إمكان نجاح عملية بحث ما أو عدمه يتوقف فقطء على ما 
إذا كانت هناك مضاهاة بين المعلومات التي تم التعبير عنها في كل من النظام 
والاستفسار الذي يقدمه المستفيد. ولكي نكون أكثر تحديداء فإن عملية البحث يمكن 
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أن تكون ناجحة» إذا كان هناك تطابق تام أو مضاهاة» بين الاستفسار والمعلومات 
التي تم التعبير عنها أو تمثيلها في مرصد البيانات؛ الذي وقع عليه الاختيار للمهمة. 
ومالم يكن الأمر كذلك. فإن عملية البحث لا يمكن أن تسفر عن أي نتائج مفيدة. 
ولهذا فإن المضاهاة هي التقنية الأساس في تنظيم المعلومات واسترجاعها. وكما يتبين 
من الشكل رقم 2١/١‏ فإن هناك عدة نقاط في عملية تنظيم المعلومات واسترجاعهاء 
يمكن أن تكون وراء مظاهر التفاوت أو التضارب في المضاهاة. ولا يتحقق المهدف 
النهائي لجحودة تنظيم المعلومات واسترجاعهاء إلا من خلال استعال مختلف الطرق 
والأساليب» وذلك للحد قدر الإمكان أو التخلص كلية؛ من مظاهر التفاوت أو 
التضارب التي يمكن أن تحدث أثناء العملية. ونناقش هذه الطرق والأساليب تفصيلا 


فيها يأتى من فصول. 


أوجه القصور في تنظيم المعلومات واسترجاعها: 

في الوقت الذي أجريت فيه أعداد هائلة من البحوث في تنظيم المعلومات 
واسترجاعهاء لا تزال هناك أوجه قصور معينة يبدو من الصعب تخطيها. وحينا تأمل 
سو انسون (1988) 50072507 الموقف بالنسبة للتكشيف والاسترجاع الآليين» استعار 
مصطلح مسليات العجز (815) 17717016716 “[0 0511:14165م»2 من إي. تايلور هويتكر 
11110167 «10نزه1 .ل؛ وصاغ تسع مسليات عجزء تبين الأشياء التي لايمكن أن 
تتم في تنظيم المعلومات واسترجاعها. وعلى الرغم من حدوث ذلك عام 1984. في| 
يتعلق بالمجال الآلي» فإن هناك عدة عبارات لا تزال تبدو مناسبة» ونقتبسها هنا: 
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مسلمة العجز :١‏ لا يمكن الإعراب عن الحاجة إلى المعلومات كاملة كطلب 
بحث... فالسؤال لا يمكن أن يصاغ بدقة إلا بعد العثور على الإجابة. 


مسلمة العجز 7:... الصلاحية ليست ثابتة» وإنا يتم الحكم عليها في حدود 


إطار متغير. 


مسلمة العجز 5: لا يمكن مطلقا التحقق مما إذا كانت جميع الوثائق الصالحة 
لأي طلب قد تم العثور.عليها... 

مسلمة العجز 4: قصارى القولء. أن المسلمات الثاني الأوليات تعني أن 
التكشيف والاسترجاع الآليين الكاملين الفعالين باطراد؛ ليسا من المستحيلات. 
والمشكلات المفاهيمية لاسترجاع المعلومات. أي مشكلات المعنى أو الدلالة» ليست 
أقل عمقا من التفكير أو أي أشكال أخرى للسلوك الذكي (96 .). 

والمشكلات المفاهيمية لاسترجاع المعلومات» كما عير عنها سوانسون 
7-» ححاسمة بالنسبة للولمام بالمجال وتطوره. ويتضح من إمعان النظر في عملية 
تنظيم المعلومات واسترجاعهاء أن ما يتضمنه هذا النشاط ى| سبق أن بيناء إنما هو في 
الأساس مضاهاة المصطلحات. وليس البحث عن المفاهيم في البيئة الرقمية؛ فعندما 
يكون مصطلح عملية البحثء. على سبيل المثال “النقل العام عناطلام 
0 -- فإن الوثائق المكشفة تحت ””الحافلات' أو '”مترو الأنفاق“ لا 
يمكن أن تسترجع, مالم يتم إعداد إحالات في اللغة المقيدة. هل يمكن لتنظيم 
المعلومات واسترجاعها أن يتجاوز يوما ما حدود مضاهاة المصطلحاتء ويقترب أكثر 
من البحث عن المفاهيم؟ ويتم البحث عن الإجابة واستكشافها بهبمة عن طريق 
التجربة والمخطاً (977[ ,1[مكتتهسى). 


81 


المراجع 


بأد 10122 أكشلعظط[ .انه 7227101 10 :11و53 لجمعء) :(995[) .51011 44 
ماالء .217110 (آلا.كع .نالانناناا 0773زك[ ,2009 ,19 7114ل لءداء12171 .(1234 
.]كا 0 


أوناء: «اء7 07 17:011هناأوطهء ينك در 985 1) مطءأ[ ,تنه78/27 2714 .) 10هغ1 21417 
0111 أهناء7716711-72171لا 40 أبزء1-[أنتلر ‏ 0 مل 5ك716ء 1ع 67 
259-99 :(25)3 ,17//1) 4 171 زه 201117:1117112110715) 


01 ,111011211 ك0 05ه] 17110 211011ع 1717511 تبش .(554[) .ءو7مء2) ,ءع1أ800آ 
710 عقع10 0 112067165 لهك لهات 1ه 116 4ء0تلامل 076 اأعقزس 
بز [معطهل[ لتتت ورمغله/17 :رم ل ترما .دع 11 اأطهطهام 


كأترء0712© ع[77اع2 1أكطك .(973[) هآ داهن ,877116 2714 82014 ,مرو 
بوىء ع أنترء لوه 4 :عززما ببح[ ,كولم 711 27110 


ب([)176 ,لطتدمال! عتتتمالم اسقط رهم عبر عم .(945[) رمونع :جه" ,العلا 
.101-10 


0 22255 01111716 00711067112111 عاراوتسطام0 .(1964) ,ل177.ل) .,تملرءبرعان) 
34-7 ,4 ,عكزآ 241:4 كعع أ ن 5 2171071 71م/:؟! .دءكوطمعلمل عتأحرو روه ناطآ1 


[1)) 930-1978[ ,كتعوممع كنءو10/! .ل! اراهن .(1992) .([ تامعء1 ,01111 

5 تهطن) ,واتااناص00) ك0 «وم1كىةط1 علا عمل «ع1نرء) :0115 7ه :741717 .( 51 

,3 «عطمقع0) 24ءدء12171 .7/4171125010 زه بر أكعوء م1071 ,17151711116 8028296 
71١‏ 5-007 .1151 .مم1 70371[ ,2009 


1127 ,1011[هذ 70ه7©2) :7716171071271 171 .(1996) .[ه آء ,تنتزآاه 7ه ,تأعناة م 
م «ء1ء50 تنو 71ع1م 172 زهت أءاطلامل .1995 ,25 أكناونا1927-4 ,8 
,105-55 ,([47)2 ,53122 171/01711611011 


71 10 0115 لاط تنه برع و امأاك1 12:1 .(1964) .4 دوملرهن) ,هعلعمناه 
289-35 ,(5)4[ ,772711211011لاع 100 1نهء 4711671 .5016712 


.للا 1016 76اع دوماع 4 :1ترعع تمه عرع 1720 1617710 7176 .(1966) .11 ,اع1اءدوا] 
57-0 ,(7)2 1 ,117716711411011 100 4171671071 


52 


[ه 21016 كه ,كزء78400 ل[ تأب[هن) ما عالاط11 4 .(1997) .16رعولائا ,007/7164 
.9 ,([6) 1[ ,أ ع3 11:6 .أوداء أ جا 71م 1ه تردد 1/0 


(تزنزرا 807112 بعططء/17 0ث1ته :زع 2ع[ ,301165 علء87 52 ,.ل 22:72 ,جده :06 
,41105 دم1 .ع5171دءع70ج7 دوملع ددا أمجنائه:: 1١:‏ 5ع771لمء1 .(986 [) .(.5لط) 
17117 04 


07 :078271101101 112 072 عأقمنها 0/6 كروعتزز و«عندء3 .(956[) ع2[ رهن ,آألمن 
(ذ- [)7 ,1171116121611071 100 1ندء 47161 .تصوعط]] أوأعءمد ١18‏ 1< كأه 171016 
.320-99 


0714 ©5112 1717/017110611011 :71016 أهء 815101 .(1987) .1221 فبرهان ,ااه 
أوتسنامل .قوط أوطاماع ع[ ها و ترارء 1:10 077:21 نم0 وجرم ”1 :تزع مآ ترتاعء1 
3386-6 ,(386)5 ,عع22ءقء5 177/01711211071 “مز نرطء 501 47716712271 1/16 07 


71 .م022 01111716 176 إن كرءعنروزظ .(996 [) .8211200 41لا 1 ,182/171 
.33-45 ,([32)1 67116711ع 12716[ 41:0 ع1718ددعع0[ 


.5 800271 7[ .(964[-1596 ) «عاء2 15ته لآ ,ات7أشة .(19785) ."1 امل ,تإعنامه] 
-324 .مم) نج [دروعع20ط بصوءططة| 77هع47:671 كز «معنره 12111 ,(.0) لمتراا 
077 كن أنه تطترط :000) ,11111011 .(326 


7/4007 .7( داهن نترنه ءالآ [1:١‏ .(996[) لأ[ عدتاءل0هل! ,«مدرءل1ه 18 
71 1716 إن أهتصياول3 .1994 ,1 «عطببرععء(19[9-1 ,24 «عؤم 0 
659-661 ,(47)9 ,ع©11© 31 :171/07771861101 امك رجاء 501 


1 .61115 71تلت 00 [ه 1ل :77مآط وتبزء 1710 .(1992) .آل[ 72716هكلاكي ,لاع أجر ةدرق[ 
لماعتة 4:1 .كتنتعاكلاى ‏ أمنعاماءم. 0عكوط-عولء ]مم11 10 آله ك 116 
343-371 ,كك ,6تجقع 101[ دا معترعع 1 أ0 111 


'"ووع 100/100 0 60117 6 (1987) .([ .كط أعه عقأ[ ,وأناءع10 
,355-592 ,(23)6 1072686711721[ عل و 71ةآووعع 270 :177/01711617101 .كناام 1 


 5(0516 7115:‏ [10ا 76171 0771211011 17 .(1968) .7177117710 .1 ,1ء51ه©:121 
17/11 بعرملا مرع ل[ .071 1ه لوده 2710 12511718 ,011072167151105 


8 994(1[) ,) 17701105 ,ل0ه0722) 4تته .7[آ عأرهلل[ ,ء[ه150تها 
7717 4ه 4 .علاع 01210 «عافاطرة:771271-007ناة[ كرت [127:000 4 :5عع0/ 1:16 
(الخجواتا 


00715 و 7أبمعوء27 :كعاراط 2710 80015 .(999[) .برءع31 آنا0ظ ,164175611 
121 7م 5019 تنمء 41671 116 07 أ14تنا0 ل ,7705267110 امكل 
1020-7 ,(5011 ,ع 5016 


53 


68 2:10 72070118 0 77121800 ماع71 4 .(1953) .2 .8 ,اناأيانا 
.14-6 ,[4)1 ,121211011© :7ل 0(آ تروء 47716 .21103 :111/0771 


كاع 2 17كط2 112:17[ 0 020611011 1110171411ه 71116 .(19355) .2 .18 ,ا7أشل 
59-15[ ,[2)2 ,1ء1ررماءدء17آ 0220 جأع ودع ]1 زه [77:2غا0ل //1 1 


5012711172 7167 0 :7117121101ءككال ‏ عدزاءءاء5 .(1961) .2 .13 ,الاأللا 
 ©011121116111‏ 71#أدو5 77202[ ع11زمجاعء[ت كزه ‏ 210 176 ط[قأنا 11071 11/017710 
.131-15 ,(12)2 ,120141117114110 477167171 


,(.0ظ1) أنه 1 .1 ابامل :ل .0115ل عأء«قدرك :عمو .(2005) 1١‏ أنعالا ,تصسطررهمل1 
4 هالأدكعع770 عع2لاع 201[ أمتنائهل1 تعدرياف نء2 ه ع1أاتمل0) .(2005) 
.عع 1 تورك علس[ ملعل[ .(11أد- عد ,درم) أومع اماع" :110ص اجدرم لت 


.(1964) ./[ ,0600071 مجه .4 لظ كأءساذ .ل .لظ .1 ,ددع [0تته »114 
كزه أمتصيمل .كوأعثر أمعةوه1هةط تنه أمءتترعتاء 171 كأ اصلامز ‏ :5201 
.147-53 ,(4)2 ,77267:121101لاع 120 أوء :211 


01 .5(5161115 |16 121716 171/01731161101 أبزء 1 .(1992) +1 كء هط ,محم ه11 
.كىءع 27 420677110 بموهخ121 


أولءاماء7 5071716 زان ,07 :صلهط ك'7ع7400 .(1960) .1 1امطه) ,ورعوه4/[ 
,111011 711611011 .1101 6ق 0111635 0714 0عكلا 2416 7715(ء1كلاى 
.1 ,(113 


.أهناء 11 171701711211011 كز كاوءء )0072‏ .(1959) .16 1/1700 ,مهم 
+ طش[ :00 ,11/1000 


عع تتوناعا 1 .(1976) .تع 127 ,0725ل عأء207رى 21:0 :512/67 ,مكزع ه10 
ام تزاء1ع50 انمع تك 1112 كزه [/7712لا0ل .1613115 1أءزوعد إن 711118[ 1ءدا 
,129-46 ,[27)3 ,316112 111/01771011011 


21 :372677101710711 111 .(2005) 0/1711ل ,1211 0710 ,11 [ورعاى ,تمكترء نم1[ 
71 0 50101 471612071 1/176 0 [7710غا0ل .701165 350 
5552-4 ,([539/5 ,عح501611 


8 71211101 كلاكى هنا 711701120م» ‏ 11:6  )1994(.‏ زع 31171 ,نز ءأصخمع1 

أوناء جاع :177/01711211011 071 ©177ع 76752[ 4 0.٠‏ 12]كآماء7 02016 5ع ع ملاع :1211 

- 105 ,[2002 ,ع©12ء1 53 17170171611012 زه أه1تلال .:[ء27ء65١‏ 2210 ع6 11عه اجر 
ْ119 


84 


01 126075 1111710 51هم 17116 :71015 [ه1711510712 .(1987) .027070 ,5011011 
مل 7ء1ع 350‏ ترمء 471271 176 07 [7712ئامل ‏ .لوباء 211 771211011م ترز 
,373-50 ,[35)5 ,©5167 171/01711611071 


01 0 2101167 :71تأناط .2 .11 .(968[) .(.20) 1 ع7قه1ن) جالألالء52 
.800/15 :انوروك :عتما مبرعء[] .مما 5612160 :50167120 


01 01/ 171167766 211161ز20111-:111171107 11:2 .([[99[) .هوطع 12 ,لمهي 
,ل( 16/712010 0710 5167122 11011 تتورم/[ زه مع اباع18 أهناتتتت4ق .[وناء راع 
3 .155-195 ,26 


.3 80114071 :17 .(965[-910[) 107117167[ ,عطيات 1 .(1975) .187 عدكءل ,57160 
-5[12 .مم) تجأجرهمع0ةط تحوع18] انمع عنم كزه «صونت0 1211 ,(.لظ) “متا 
4 11516716 :00 ,1111161011 ./513 


0 80016 «دم«1 :ك1تتواع 0 كرء4للامناى 1186 0 .(993[) .5 بااعطموتاط ,31111 

71220 اغا م0771 كزه 021122711 [©<046 2120 ك25راع 071 1712 :2طلاه 1 10 51107171011 

71 --27111 65 176 10 06111177 الو [-711110 11:6 7171م 117/01711611011 
.217-66 ,(2)2[ ,دء 7ه نطارآ 2110 «عه 17:01 


1 0 171127276141101 أهء 511 لهاي 4 .(1972) .ترء ته[ ,0715ل عل0 2ل 
هت أ04اصسنامل ‏ .أهناء]ماء 7‏ 171 17011هء 1 أجرجره - ك] 1‏ 0,70 :جات ترا 506 
11-21 ,([28)1 ,:11011 1006171161114 


026711112111 72171611 171/01771611011 .( [198) .(.0ط) مغل ,0115ل عأ دري 
1 :10110011 


1 111 1/7000 171/01711011011 ©1116 117101718 .[1994) .عنمل ,د5عترمل عل ندري 
عع00) 116 21 160عدء م 1ه 1 .[عترمامء17:2] 1726 عع2لاع1211 [ه 1101 
71 1ك .111621118 ع171كلاح11تمن) 171 تع تترن/17 كرن :11ج 7ط [06) «رعودره 11 


71 1110-2 زه 1نمقاعه19/1 .(1[993) .127 ,0715ل علع ررد 
291-14 ,(3[)3 ,92711711 147:6/[ عل ع171ووع00 م 


1110 011 كدمقاعء 72/1‏ «عطاميل ‏ .(2000). .رمعل ,0165ل عأن دري 
.37-55 ,([[36)1 ,677116711 107:68[ يل ع71آددعء م2 171/01711211011 


/4110:12اناص00) .11716 2 :11 17115مع 507116 .(2005) .127271 ,707165 عل من 
ْ 1-14 ,(1) 31 ,كع ةاكتلاع شآ 


86 0 512416 11:6 :71117107121118هاى ©771211م1باق .(2007) .127611 ,0115ل عل 57817 
[45[-1449 ,(43)6 ,7711© ع 7427106 عل ع 77آدوعء 20 011071 :111/07 .001 


55 


كع 271لهء12 .(1997) .لولط) «عاءظ بلاع !17/11 0:14 ,1(ء 127 ,70715 علع جرد 
71 1 :من داع تبه[ اتوى .أوبع أ جاء< :111/01171261107 


1 .5212111151 171/01711611011 ,اتطأضا .2 .8 .(968[) .[اءطموةقاط تدصعال! ,وتعنء51 
:516712 171701711011011 لزن زعع21071 انط .7ط ,(.لظ) جاأساع3 6ل ءعقهان 
.820015 تتمانومك نأمطا بع ل7 .(24-30 .ورم) ي[زمم 0ع1عء561 


#مبررع-70ه-[ه ]17 2 5ه أوناء ١17‏ 172/01711211011 .(1977) .1 :1007 ,715011 نلك 
.125-14 ,(47)2 ,بإاعء 0121 بصععطشآط .ددءء10ز] 


هتت2 أهناء ١21‏ :172/071221101 :7:01 أمء1ىم )كط .(1[988) .غ1 :1201 ,07:5071ناك 
#مر «لءاع50 ارمع ة7عتتتمقم كزه ‏ أهتتمل ‏ .اتماكس ]11 :7ه زه ع تناأنتل 1/16 
١‏ .92-5 ,(49/2 ,عع ترعتع3 مأ هدرم 1 


2م121 أمعنائهل! :عكتلامء مك2 © ع 027110 .(2005) (.ل) .[ تتنتأول 1011 
لع 3271712 تعأرم[ دعل[ .أوباء 121 171/01771411011 0710 ع71آووء 210 


تممزر ,2005 ,3 «ءط:رععء12 لعنبعاماء؟1 .آوزأاء 11 .(2001) .اعع 127 ع1 
.11147961 16 1ن 


م7 مه77 ,لم 284 7 10 ك4 تمعز عتتعرء 10 .(1[995) .8 دمندظ ,تعد ذااء/11 
ا 2 


-933[) دعترمل عأء تقو نم1 :11زه متعم 17 .(2007) عل 1171/77 
.8-9 ,(22)3 ,15نوعاكنزك ]عع 1 1أء 1:1 111 .(2007 


121 :7116710710711 172 ,(2007) .51217271 ,7هك1زءط10 مه ماعط ,11 ]ا 
.605-06 ,([63)5 ,7116711211071لاع00آ 0 أهاتغنامل .ىع :تمل عأ رقررى 


2114 718قلاع01210© 2 10 11011ع/ل17110 .(19860) .د 8017021 ,نعدركاا 
ةلعلا وماج رطئط :00 ,ناما لنالط ,لع لام 021 


86 


الفصل الثاني 
تنظيم المعلومات - الطرق الرئيسة 


تحتاج المعلومات المسجلة رسمياء في مختلف أنواع الوثائق (كبحوث المؤتمرات» 
والتقارير التقنية على سبيل المثال) لأن يتم تنظيمها لكي يكون من الممكن استرجاعها. 
ولا يمكن بحال أن يتم استرجاع المعلومات بالوثائق الأصلية نفسهاء وإن| تتم عملية 
الاسترجاع ببدائل الوثائق أ شكل كشافات» ومستخلصات» وملخصات. وما شابه 
ذلك. ويدل التنظيم في هذا الكنظاب على الجوهر أو المحتوى الموضوعي للوثائق 
بواسطة طرق معينة» وذلك على الوغم من أن الناتج النهائي يمكن أن يتخذ أشكالا 
مختلفة. وينبغي في الظروف المثاليّة» أنأتتم عملية التنظيم ببساطة وكفاءة» إلا أنه كما 
لاحظ لسك (1997) عاوع.آ[: 


إذا كانت لدينا خطة واحدة لتنظيعهاللعررفة:يتكفل لنا وضع 
كل فكرة في مكان واحدء وإذا كان المستفيدذوك على دراية بهذه 
الخطة» وبإمكانهم وضع أي من استفساراتهم في إطارهاء فإن 
الاسترجاع ال موضوعي يمكن أن يكون واضح المعالم... ولا يبدو 
عملياء من الممكن لأي خطة لتنظيم المعرفة؛ أن تخدم جميع 
الأغراض (99-100 .مم). 
وفضلا عن ذلكء فإن الطريقة التي يمكن أن تستخدم بها خطة التنظيم؛ على 
نحو مطرد ودقيق» تثير تحديات لاختصاصيي المعلومات» حتى وإن كان اختيار 
الخطط لا يشكل هما. كما أن بعض الطرق (كالاستخلاص مثلا) لا تتطلب خطة لكي 
يتم تنفيذهاء فتنظيم المعلومات إطار يعني التحدي والتعقد والفروق الدقيقة. 
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لقد كان التكشيف من الطرق التي تستخدم عإن نطاق واسع لتنظيم 
المعلومات. ويستخدم التكشيف المصطلحات (أي الكلمات أو العبارات) سواء كانت 
هذه المصطلحات مستقاة أو مشتقة من النصء أو معينة للنص» وذلك للتعبير عن 
الجوانب المهمة للوثيقة الأصلية. ويتراوح عدد المصطلحات الكشفية» التي تستعمل 
للتعبير عن محتوى وثيقة ماء ما بين بضعة مصطلحات في مراصد البيانات الوراقية. 
وعدة مئات في نظم النصوص الكاملة. 


ويشكل التحليل المفاهيميء وترجمة الوثيقة” التي يتم تكشيفها الجانب 
الفكري لعلمية التكشيف. ولكى نكون أكثر تحديداء فإن التحليل المفاهيمى في 


(*) حتى لا يثير استعمال كلمة "ترجمة'' في هذا السياق شيئا من اللبس أو الغموض. نود أن نوضح أن 
الترجمة لا تتم للوثيقة كاملة» وإنما لعناصر المحتوى الموضوعي التي وقع عليها الاختيار» وتأتي 
الترجمة في مرحلة لاحقة لهذا الاختيار؛ فجميع عمليات المعالجة الموضوعية لأوعية المعلومات» 
سواء في التصنيف أو الفهرسة الموضوعية. أو التكشيف أو الاستخلاصء تمر بثلاث خطوات؛ 
أولاها الإحاطة» أي الإلمام بمختلف عناصر المحتوى الموضوعيء أي تكوين صورة شاملة كاملة 
لمحتوى الوثيقة. والخطوة التالية هي اختيار أو انتقاء عناصر المحتوى الموضوعي الأهم من 
غيرهاء والجديرة فعلا بالتنويه أو الإبراز» في ناتج التحليل الموضوعيء وتسمى هذه الخطوة 
الترجيح. ثم تأي خطوة الترجمة» أي تحويل الصورة التي ارتسمت في ذهن المسئول عن المعاللجة 
الموضوعية للعناصر الجديرة بالتنويه؛ إلى اللغة المستعملة في التعبير عن ناتج التحليل» سواء كانت 
هذه اللغة خطة للتصنيفه أو قائمة لرؤوس الموضوعاتء أو مكنزا. ويمكن أيضا القول بأن 
المعالجة الموضوعية تمر بمرحلتين؛ الأولى هي التحليل» وتشمل الإحاطة والترجيح. والثانية هي 
الترجمة. راجع في ذلك: 
.22 320 لتمع:11 18 25512408 له عسترعلم] .1.77 ,«عأكدعمه1 (1) 
4550121600 لوطا[ و0 لصو] .لء ف35 
(؟) لاتكسترء فردرك ولفرد. نظم استرجاع المعلومات. ط؟. ترجمة حشمت قاسم. 
القاهرة. مكتبة غريب» .19/1١‏ 
إفرة لانكسترء فردرك ولفرد وآمي وورنر. نظم استرجاع المعلومات. ط". ترجمة 
حشمت قاسم. الرياضء مكتبة الملك فهد الوطنية» /14951. 
(4) حشمت قاسم. مدخل لدراسة التكشيف والاستخلاص. القاهرة» دار غريب» .7٠٠١‏ 
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التكشيف ينطوي على التحقق من المفاهيم الرئيسة التي تحظى بالتغطية في الوثيقة 
وترجيح المفاهيم الجديرة بالتنويه. بين| يحوّل الجانب الخاص بالترجمة فعلا المفهوم 
الذي وقع عليه الاختيار» إلى مصطلحات كشفية اعتمادا على لغة التكشيفء التي وقع 
عليها الاختيار سلفا. وسوف نناقش لغة التكشيف على وجه المخنصوص.ء مع لغة 
الاسترجاع في الفصل الرابع. 
أنواع التكشيف: 

يتوقف نوع التكشيف عادة على الطريقة ة التي يتم بهاالحصول على 
المصطلحات؛ فإذا كانت المصطلحات مقتطفة أو مستقاة من النص الأصلي للوثيقة» 
فإنهيسمى التكشيف الاشتقاقي ©0651978119. وفي مقابل ذلك. إذا كانت 
المصطلحات معينة 355150260 للوثيقة فإنه يسمى التكشيف بالتعيين 3551521136116. 
ومن الممكن أيضا معاملة التكشيف الاشتقاقي بوصفه مرادفا لتكشيف الكلمات 
المفتاحية» نظرا لأن المصطلحات الكشفية يتم التقاطها مباشرة من الكلمات المفتاحية 
الواردة في النصء ولا يتم الرجوع إلى أي لغة مقيدة. وفي مقابل ذلك فإنه يتعين 
استعمال لغة مقيدة في التكشيف بالتعيين لضان استعمال المصطلحات الملائمة. 

وعادة ما تسمى المصطلحات الكشفية التي يتم تعيينها من لغة مقيدة, 
بالواصفات 4055م065051. وذلك على الرغم من أن اللغة المقيدة المستخدمة قد لا 
تكون مكنزا. وإذا كان المفهوم الذي يتم تكشيفه جديداء أو تصادف أن كان علا 
(كالسور العظيم مثلا) ولا يمكن العثور على مقابل له في اللغة المقيدة» فإنه يمكن 
إعداد محدد للهوية 1468411367 في التكشيف بالتعيين. وبعبارة أخرى» فإن محددات 
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الحوية» مصطلحات يعينها المكشفء ولكنها لا تستقى من لغة مقيدة. وكما سبق أن 
ذكرناء فإن المصطلحات التي يتم التقاطها في عملية التكشيف الاشتقاقي تسمى 
كلات مفتاحية. 

وأحيانا ما يسمى التكشيف دون الاعتماد على لغة مقيدة بالتكشيف الحر 
(1993 ,2دقتصعنا1). ويطبق التكشيف الحر بوجه عام في التكشيف الاشتقاقي. 
و النحو نفسه. فإن التكشيف بالتعيين عادة ما يتم باستخدام إحدى اللغات 
المقيدة. وكون الأمر يتطلب استخدام لغة مقيدة في التكشيف. من القضايا المثارة 
عبر السنين» ولا تزال المناظرة حوها مستمرة. وبوجه عامء فإنه مع تزايد توافر 
المعلومات رقمياء يتراجع استخدام اللغات المقيدة في التكشيف. نظرا لعوامل الكم 
والكيف. 


التكشيف الآلي والتكشيف المعتمد على الآلات: 

من الممكن تقسيم جميع الأنشطة التي ينطوي عليها التكشيف إلى فئتين؛؟ 
الأنشطة الفكرية والأنشطة الآلية لهءتهقطء6مم. وقد تناولنا الجانب الفكري 
للتكشيف في القسم 7/ .١‏ أما الجوانب الآلية في التكشيف فتشمل في المقام الأول 
أنشطة كالترتيب الهجائي وصياغة المداخل الكشفية. وبين| يظل الجانب الفكري من 
التكشيف مهمة بشرية في معظم الأحيان» نظرا للوضع الراهن للبخث في الذكاء 
الاصطناعي» فإن عمليات التكشيف ذات الطابع الآلي» يمكن أن تتم على نحو مرضس 


بالحاسبات. وإذا ما استخدمت الحاسبات في معالجة كل من الجوانب الآلية والفكرية 
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للتكشيف» يصبح هناك تكشيف آلي ©0400801ا8. أما إذا ما استخدمت الحاسبات في 
العمليات التكرارية فقط في التكشيف. بينها تتحمل المكشفون من البشر مسكولية 
الجوانب الفكرية للتكشيفء يصبح هناك تكشيف معتمد على الآلات 31110818160. 


ويبدو التكشيف الآلي» الذي يعرف أيضا بالتكشيف بواسطة الآللات 
عسأعدعله] عمنتطعقص حلا له جاذبية» خاصة بالنسبة لمشكلة الاطراد والتكلفة 
المرتفعة المرتبطة بالتكشيف اليدوي. إلا أن الضعف الجوهري للتكشيف الآلي» يكمن 
في عجز الحاسب عن التعامل مع الجانب الفكري للتكشيفء إلا بمساعدة اللككشف 
البشري» وفي معظم الأحيان يكون أداء الحاسب أسوأ بكثير من أداء اختصاصي 
المعلومات. والسبب في ذلك واضح؛ فالحاسب لا يستطيع في الواقع التفكير» كما أنه 
لا تنوافر له القدرات التحليلية التي يتمتع بها الإنسان. وفي مقابل ذلك؛ يمكن 
للتكشيف الآلي إعفاء المكشفين البشر من مهام التكشيف التكرارية المرهقة» وبذلك 
يكون بإمكانهم التركيز على نحو أكثر» على المهام الفكرية للتكشيف. 

ولا ينبغي» من ناحية أخرىء التهوين من قدر التكشيف الآلي» وخصوصا 
عندما تكون كميات المعلومات المراد تكشيفها ضخمة؛ إذ عادة ما يعتمد هذا الضرب 
من التكشيف على خوارزميات متعددة» من بينها تبدو طريقة إحصاء تردد الكلمات 
المفتاحية الأكثر شيوعاء وقد استخدمت فعلا بكثافة. وتستند طرق التكشيف الآلي 
الأخرى بوجه عام؛ على تقارب الكلمات المفتاحية» وموقعهاء والاحتالات» 
والخصائص اللغوية. ى) تدخل اللغات المقيدة في بعض تطبيقات التكشيف الآلي 
أيضاء إلا أن نجاح مثل هذه الطريقة يتأثر سلبا بالطابع الآلي للتكشيف الإلكتروني. 
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التكشيف في بيئة التدظيم الفائق 

يتزايد توافر المعلومات في بيئة التنظيم الفائق ©:5ا)ع62540م:قط» التي تتمثل 
في العنكبوتية العالمية <اء'78 777106 9870510. وبالنسبة للمعلومات المعتمدة على 
العنكبوتية» فإنه من الطبيعي إلى أبيعد حدء تقديم المصطلحات الكشفية بوصفها 
روابط فائقة 5ئ[ه6:[1م153. تتضمن كلا من المصطلحات الكشفية وتقنية تحديد المكان 
دموتسقطع2 «10630. وبعبارة أخرى» فإن أسماء الروابط الفائقة تم تقوم مقام 
المصطلحات الكشفية» حيث تقود طريقة الروابط الفائقة المستفيد بسلاسة» إلى حيث 
تشير المصطلحات الكشفية. وبالمقارنة ببيئات التكشيف الأخرىء فإن هذا النظام 
فريد من النواحي التالية: 

أولاء ترد المصطلحات الكشفية في بيئة التنظيم الفائق كامنة في ثنايا الوثائق 
نفسهاء وليست ككيانات منفصلة خارج السياق. ثانياء تندمج المصطلحات الكشفية 

وتقنئية الوصول إلى المكان معا في وحدة واحدة, بدلا من ورودهما منفصلين. ثالشاء لا 

ينعكس التقسيم الحرمي الموضوعيء أو مفهوم المداخل الفرعية في التكشيف 
التقليديء تماما أو بحذافيره في بيئة التنظيم الفائق. رابعاء لا يمكن النظر إلا للروابط 
القائمة على المحتوى» في التنظيم الفائق» بوصفها مصطلحات كشفية» بين| لا يمكن 
للروابط التنظيمية» '”كالصفحة التالية“ و”رأس الوثيقة“ أن تعد كذلك ,نتط©) 
(1997. خامساء ينهض المؤلفون بدور المكشف غندما يقومون بإعداد وثائق التنظيم 


الفائق» ى) يتم التكشيف تزامنيا مع إنشاء الوثائق إن لم يكن قبل ذلك. ويترتب على 
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ذلك احتمال كثافة ورود مصطلحات (من قبيل “اضغط هنا'' على سبيل المثال) تلك 
المصطلحات التي لا يحتمل لها أن يقع عليها الاختيار من قبل المكشف» بوصفها أسماء 
روابط. في بيئة التنظيم الفائق. سادساء تراجع احتمالات التفاوت بين الوثائق الأصلية 
والمصطلحات الكشفية» في ظريقة تنظيم المعلومات هذه؛ نظرا لأن المؤلف هو من 
يقررء أثناء كتابة الوثيقة» أي المصطلحات ينبغي أن تصبح روابطهء بينا يحدث في 
التكشيف التقليدي أن يكتب المؤلف الوثيقة» ثم يحاول المكشف بعد ذلك تحليلها 
لأغراض التنظيم. 

ونظرًا للخصائص الفريدة للتكشيف في بيئة التنظيم الفائق, فإن الوثائق الفائقة 
عمسو بم ادف برقن مال اسل ا 
يختار أسماء الروابط بعناية» عند كتابة الوثائق الفائقة (1997 منقظ©). 


التميبز الاجتماعي: 

بدأ التمييز الاجتماعي 1288128 [50012: الذي يختلف مام الاختلاف عن 
التمييز بإاحدى شفرات التحقق من الطوية ©00© 1062115621102 (كالتحقق بالتردد 
اللاسلكي 1110 - متاق كناد 10 :رزعمعسوع"5 2016 على سبيل المثال) يزداد 
كار راوع ومرة ع كه بتر حوريرة اسه اسع ماني أجلن 
”تكشيف» المعلومات على الإنترنت. ويتتمي التمبيز الاجتماعي» مرتبطا بالتطبيقات 
الأخر 5 الرامية إلى مشاركة المستفيد (كالتدوين 51088188 والمواقع الجماعية على 


العنكبوتية 5ذكلة18) إلى حركة الجيل الثاني للعنكبوتية 2.0 ط756 ,لإللغ'0) 
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(2005. وتشمل النظم المبكرة المزودة بتقنية تمييز فلكر 1”11» وهو موقع شهير على 
العنكبوتية لتقاسم الصور الضوئية» و15ا.061.160 الذي تغير اسم نطاقه إلى 
تمء.كناهك 111 عام .٠٠٠1‏ ففي مثل مواقع التمييز هذه» يمكن للمرء أن يصف أو 
يعقب على ما يراه أو يسمعه. بتمييزه بكلمات أو عبارات من اختياره. 

والتمييز» إلى حد بعيد» نشاط مماثل لتكشيف الكلمات المفتاحية الذي سبقت 
الإشارة إليه في هذا القسمء إلا أن تكشيف الكلمات المفتاحية يتم إجراؤه بواسطة 
المكشفين» ومؤلفي الوثائق التخصصية» ونظم استرجاع المعلومات» بينا يتم إجراء 
التمييز بواسطة أي مستفيد من الإنترنت. ونظرا لهذا الاختلاف الجوهريء فإن التمييز 
لا يبدو مقابلا لتكشيف الكلات المفتاحية» وإن كان من يارسونه 1888675 يميلون 
لاختيار أسماء أو عبارات اسمية كتيجان 885]» في معظم الأحيان :2007 ,همكة) 
(2008 ,لا[:© يق 3از). يضاف إلى ذلك وجود المشكلات التي يعاني منها تكشيف 
الكلمات المفتاحية (كالمترادفات» والمشترك اللفظي أو الجناسء وتعدد أشكال 
الكلمات»؛ على سبيل المثال) جميعها في التمييزء إن لم تكن على نطاق أوسع. إلا أن 
للتمييز» كطريقة ناشئة وبديلة للتعبير عن المعلومات أو تمثيلهاء احتماللات عريضة في 
تيسير استرجاع المعلومات» نظرا لآن التيجان التي ينشئها المستفيدون» من بين مزاياها 
الأخرى (كتوفير المزيد من نقاط الوصول على سبيل المثال)؛ من المرجح إلى حد بعيده 
أن يتم اختيارها من قبل المستفيدين النهائيين أنفسهم كمصطلحات استفسار للعثور 
على المعلؤمات. 
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وكأسلوب ناشئ لتنظيم المعلومات أو تمثيلهاء حقق التمييز ابتكارات من شأنها 
إثراء تجال استرجاع المعلومات (2008 ,)نته8). والتصنيف المتعارف عليه 
10115011013137 من بين هذه الابتكارات. وقد سك توماس فاندر وال 1208385 . 
71 17220 كلمة 101150200 عام : ٠٠‏ 27 وهي تركيب مزجي من كلمتي 
15 ىئ03ه18:0 (2007 ,71311 «علصة؟). ويعبارة أخرى فإن التصنيف 
المتعارف عليه 10116508033 تصنيف شجري أو هرمي [48:00083» قائم على 
التيجان التي ينشئها القوم 5كل01؟ أو المستفيدون النهائيون. ويشتمل القسم 4/ 4 على . 
مزيد من المناقشة لكل من التصنيفات الشجرية والتصنيفات المتعارف عليها. وعادة ما 
تتخذ التصنيفات المتعارف عليها شكل حشد من التيجان 1000© 8هاء وهو تجمع من 
التيجان التي تنشأ في موقع تمييز ماء اعتمادا على الترددات المميزة. ويمكن لحشد 
التيجان أن يساعد المستفيدين في اختيار المصطلحات الملائمة سواء في عملية التمييز أو 
في عملية الاسترجاع. 


التقسيم الفئوي: 


يدل التقسيم الفنوي 080680112:8008 على التنظيم التسلسلي والهرمي 
للمعلومات أو تمثيلها بفئات. ويمكن أن يكون هناك ضربان من التقسيم الفئويء تبعا 
لما إذا كانت هناك خطة نسقية متطورة مستخدمة أم لا. 


أنواع التقسيم الفئوي: 


عادة ما يتم التقسيم الفئوي وفقا لخطة تصنيف مستقرة» كتصنيف ديوي 
العشري (101000) وتصنيف مكتبة الكونجرس (1,)000). وتسمى تطبيقات التقسيم 
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الفئوي هذه على هذا النحو بوجه عام؛ بالتصنيف الذي يمكن أن يطبق على وجه 
العموم على مجموعات المكتبات ومرافق المعلومات. وتشمل رموز التصنيف الأرقام» 
أو الحجائيات» أو الأرقام الحجائية. 

ومع ظهور الإنترئت» نشر الكثير من المعلومات على هذه المنصة الجديدة. 
وتتقاسم المعلومات على الإنترنت بوجه عام الخصائص التالية» وهي: الطابع المؤقت 
أو سرعة الزوال [58»معطامعء. والجودة المتفاوتة إاتلهددو 0ع«نص والكميات 
الهائلة. ولهذا فإن طريقة التصنيف تبدو باهظة التكلفة؛ أو غير ملائمة» أو غير مجدية 
لتنظيم المعلومات أو تمثيلها على الإنترنت» بين يبدو التقسيم ال حرمي أو الشجري 
القائم على فئات غير محكمة البنيان» الإطار المناسب لتنظيم المعلومات من هذا الطابع. 
وياهو! !00طهلآ ولاشك. رائد في هذا المجال» إذ أصبح أنمو ذجا لتنظيم المعلومات 
أو تمثيلها على الإنترنت» وعلى العنكبوتية العالمية على وجه الخصوص. وترد الفئات في 
التصنيفات الشجرية من أجل تنظيم المعلومات المعتمدة على العنكبوتية» أو تسجل 
مباشرة بوصفها روابط فائقة. ولا تستخدم أي رموز كده]0]8ه (كالأرقام أو 
الحجائيات أو الأرقام ال هجائية مثلا) للدلالة على العلاقات الشجرية أو غيرها في إطار 
التصنيف. ونقدم المزيد من التغطية للتصنيف في الفصل الرابع» إلى جانب مناقشة 
التصنيفات المتعارف عليها 101150201165 والتصنيفات التخصصية 022]01081©5. 


أسس التقسيم الفئوي: 


عندما يقع الاختيار على التقسيم الفئويء كطريقة لتنظيم المعلومات أو تمثيلهاء 
يتم تخصيص فئة واحدة أو فئتين أحيانا للعناصر التي تغطي موضوعات بينية أو 


متعددة الارتباطات إتهستامكل015ءغ)مآ في وئيقة معينة. وبعبارة أخرى. فإن وثيقة 
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بعينها ينبغي أن تعين لفئة محددة واردة في النظام القائم للتقسيم الفئوي. ويتطلب ذلك 
أن تكون الفئات التي وقع عليها الاختيار لنظام التقسيم الفئوي في الوقت نفسه: 
© شاملة ©1:5113105019. 


© قائمة بذاتبا ©٠أوتااءءدء‏ 10612113 


ويقصد هنا القول بأن جميع الفئات التي يمكن أن تدعو الحاجة إليها لتنظيم 
المعنومات أو تمثيلهاء ترد في نظام التقسيم الفئوي. ولا ينبغي في الوقت نفسه لأي من- 
هذه الفئات أن تكون متداخلة فيم| بينها. وما لم يتوافر الشرط الأول فإنه لن يكون من 
الممكن التعبير عن بعض المعلومات أو تنظيمها بالفئات المتاحة في الخطة. ومالم يراعى 
الشرط الثاني فإنه يمكن حينئذ اختيار أكثر من فئة واحدة لتمثيل الوثيقة الواحدة. 
ومن شأن أسس أخرى كالمرونة مثلاء أن تيسر الاستخدام. وعلى الرغم من أهمية 
المرونة» فإنها ليست جوهرية كهذين الأساسين السابقين. 
اندماج طريقتي التقسيم الفئوي: 

يكمن ما يميز أياً من طرق التقسيم الفئوي بحن غيرهاء في المقام الأول» في 
طبيعة الإطار المتبع لأغراض تنظيم المعلومات أو تمثيلها. فقد أكد التصنيف,. وقد 
صمد لأنواع متعددة من الاختبارات» مكانته كطريقة بارزة لتنظيم المعلومات. أما 
التقسيم الشجريء فعلى العكس؛ إذ ينظر إليه بوصفه طريقة سريعة غير ناضجة 
لتنظيم المعلومات. ومع تزايد توافر المعلومات المهمة الجيدة على الإنترنت» بدأ 
التصنيف يستخدم للتقسيم الففوي للمعلومات المعتمدة على الشبكة 
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(2001 ,تقصح1ك31 على سبيل المثال). وفي الوقت نفسه تم تنقيح الأطرء 
وتطويرها لأغراض التقسيم الشجري والارتقاء بهاء بإدخال الخصائص التي صمدت 
لاختبار الزمن» تلك الخصائص التي نشأت في كنف خطط التصنيفء كالتنظيم أو 
التقسيم الشجري. 

وفضلا عن ذلكء تزايدت جهود استكشاف التقسيم الفئوي للنصوص 
بالوسائل الآلية (1999 روصقلا و1998 .21 أء ,»801 على سبيل المشال) و ذلك 
بالاتجاه نحو التقسيم الشجري 'إتسمصؤيها لا التصنيف «مناهء ل أوعدلء”. 5 
تزايد كم المعلومات التي تتاح رقميا. وبينم| اجتذب التصنيف الآلي يوما ماء قدرا كبيرا 
من اهتمام الباحثين فإن القدرات العقلية اللازمة للتصنيف المنضبطء تبدو صعبة 
التحقيق في الخوارزميات القائمة على الآلات دون سواها. 


التلخيص: 


على عكس التكشيف أو التصنيف أو التقسيم الفئوي» فإن التلخيص يحاول 
التعبير عن وثيقة ما أو تمثيلها بفقرة أو ائنين» أي بملخص أو شكل مركز للأصل. 
وتحدد درجة التركيز والطريقة التي تتبع معالم الطرق المختلفة للتلخيص. 


(*) أيا كان المصطلح المستعمل للدلالة على التقسيم الفئويء فإن التقسيم الفئوي هو الأساس في 
المعالجة الموضوعية للوثائق أو أوعية المعلومات؛ فالترتيب الهجائي للمفردات تقسيم فئوي» 
والفهرسة الموضوعية تقسيم فتوي لأنها تؤدي إلى نشأة فئات من الوثائق أو أوعية المعلومات» 
وكذلك التكشيف. أيا كان شكله وتقنياته» تقسيم فئوي لأنه يؤدي أيضا إلى نشأة فئات» بما في 
ذلك تكشيف الاستشهاد المرجعي ودتدء لما دهن هاك. (المترجم) 
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الملستخلص 80515864 تمثيل موجز دقيق لمحتوى الوثيقة. ولقدكان 
الاستخلاص» أي عملية صياغة المستخلصات. يتم أساسا بواسطة البشرء على الرغم 
من بذل بعض الجهود الآلية (1958 ,سطناءآ على سبيل المثشال) فيما مضى. 
فالمستخلصات ينبغي مثاليا أن تصاغ بأسلوب مماثل للأصلء إلا أن ذلك المعيار من 
الصعب الوفاء به» نظراً للفقدان الذي لا مناص منه للأصالة أو الموثوقية» أثناء عملية 
الاستخلاص. ا 
ومن الممكن أيضا تقسيم المستخلصات إلى ثلاثة أنواع؛ المستخلصات 
الإعلامية أو المعلوماتية 184051381176 والمستخلصات الكشفية ©265ء01مل 
والمستخلصات النقدية [510168©. وتشتمل المستخلصات المعلوماتية على المعلومات 
الجوهرية الواردة بالوثيقة الأصلية» ولهذا فإنها يمكن أن تقوم مقام البديل. واعتادا 
على المستخلصات المعلوماتية يمكن للمرء أن يقرر ما إذا كان بحاجة لأن يطلع على 
الوثيقة الكاملة. أما المستخلصات الكشفية فإنها يمكن في مقابل ذلك أن تتصف 
”“حيثيات أو محتوى 2501343655 الوثيقة الأصلية» مع استبعاد تفصيلات معينة 
كالمنهج والتتائج» ومن ثم فإنها لا يمكن أن تعامل بوصفها بديلا عن الأصل. وعلى المرء 
الاطلاع على الوثيقة الأصلية» للحصول على تصور شامل لها. وتسمى المستخلصات 
النقدية على هذا النحو؛ نظرا لأنها لا تمثل محتوى الوثيقة موضوع الاهتمام فحسبء وإنما 
تحاول أيضا تقييم ذلك المحتوى. ولا يوصى بهذا الشكل من المستخلصات؛ نظرا لأن 
المستخلصات بطبيعتهاء ينبغي أن تخلو من أي تأويل أو تفسير أو أحكام. ولا ينبغي بوجه 
عام كتابة مستخلصات نقدية مالم يطلب من المرء ذلك.. 
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وكا سبق أن أشرناء فقد استكشف الباحثون طرق إعداد المستخلصات الآلية» 
إلا أن الناتج النهائي يبدو الآن في جوهره. أقرب للملخصات الآلية أو المقتطفات 
الآلية» منه إلى المستخلصات الآلية» لأنه يتكون في المقام الأول» من جمل مفتاحية. 
مقتطفة أو مقتبسة من الوثائق الأصلية. 
الملخصات: 

الملخص إعادة صياغة للنقاط الرئيسة الواردة في الؤثيقة الأصلية» يرد في صدز 
الوثيقة أو ني نهايتها. وعلى الرغم من قربه من المستخلص. فإن الملخص عادة ما يفترض 
أن القارئ سوف تتاح له الفرصة لإمعان النظر في الوثيقة الكاملة. ومن ثمء فإن هناك 
عناصر معينة» لاغنى عنها للاستيعاب الكامل للوثيقة» كالأقسام المتعلقة بالخلفيات أو 
المنطلقات» والهدف؛ و المنهج» عادة م تغيب من الملخص (1992 ووع1؟080). 


ولقد تطورت خوارزميات لتلخيص النصوص آلياء وخصوصا تلك 
النصوص التي تتخذ الشكل الرقمي» في غضون السنوات القليلة الماضية ( علعمةقم8 
155 راع وإعمسعوع 1ددع ملص8 يعن ععصمل عاءصقم5 :2001 ,وعهمل على سبيل 
المثال». ويبرز التلخيص الآلي» في الواقع» بوصفه مجالا للبحث الجاري في الذكاء 
الاصطناعي (41). ويمكن لبعض الباحثين تسمية منتجاتهم النهائية؛ من البدائل أو 
التمثيلات بالمستخلصات. إلا أنه من المعروف ولاشك. أنه لا يمكن إلا للبحث في 
الذكاء الاصطناعي» أن يكون قادرا على أن يجعل من الاستخلاص الآلي حقيقة 
واقعة» ولم يتم تطوير خوارزميات الذكاء الاصطناعي هذه بنجاح. ونواصل مناقشة 
التخليص الآلي في القسم 7/١7‏ 7/ ؟. 
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المقتطفات: 

يتكون المقتطف 586ان» من جزء واحد أو أكثر من وثيقة ماء يتم التقاطه 
لتمثيل الكل. ولا يمكن للمقتطفات أن تكفل قثيلا مناسبا للوثائق الأصلية, إلا أنبا 
يمكن أن تكون لما أهميتها بالنسبة للقارئ الذي ميتم بحصيلة أو خلاصة دراسة 
معينة. ولا يمكن بحال النظر إلى المقتطفات بوصفها بدائل للوثائق الأصلية. 

والمقتطفات» وإن كانت قدرتها التمثيلية أدنى من تلك الخاصة بكل من 
الملخصات والمستخلصات. من الممكن بناؤها كاملة بالطرق الآلية. وتستخدم معظم 
نظم استرجاع الإنترنت. بها في ذلك جوج ل مقتطفات آلية لأغراض ثيل 
المعلومات. ومن الخصائص السيئة للمقتطفات الآلية التي تنتجها نظم استرجاع 
الإنترنت» أن المقتطف عادة ما ينتهي بعلامات الحذف 5أومفلاء عندما يصل إلى نقطة 
التوقف 4دزهم 011 ته التي يحددها النظام. من ثم فإن جودة المقتطفات الآلية أمر 


يثير المخاوف أو لا يدعو للاطمئنان» عندما تستخدم لتمثيل الوثائق. 


ملخص الموقع الثري: 

آر إس إس 855؛ الشكل المختصر الذي يقوم مقام ملخص الموقع الشري 
'ا#قتصدصنا5 5116 طء81؛ تطبيق آخر للجيل الثاني للعنكبوتية العالمية 2.0 876 
يمكن أن يستخدم لأغراض ثيل المعلومات. وبمزيد من التحديد» فإن ملخص. 
الموقع الثري يعتمد على صيغ ملف يسمى ملقمات 16605 يقوم بتجميع المعلومات 
التي استجدت حديثا من عدة مصادر على العنكبوتية. وبإمكان أولئك الذين 
يشتركون في ملقمات معينة» عن طريق قارئ ما (أي برنامج تجميع 3887688]07) أن 
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يتلقواء على حاسباتهم, المعلومات التي تتيحها حديثاً هذه الملقمات. ومن ثم فإنه 
يمكن النظر إلى ملخص الموقع الثري بوصفه خدمة إحاطة جارية. في بيئة العنكبوتية 
العالمية» تقدم للمشتركين ملخصات للمعلومات التي تتاح حديثاء من المصادر التي 
ييتمون بها. وبهذا المعنى يبدو ملخص الموقع الثري اسم ملائما لهذا التطبيق. 

وإدراكا وتقديزا منهم لأهمية ملخص الموقع الثريء ابتكر أولئك الذين 
ينهضون بمهام في تجمع العنتكبوتية العالمية ط6؟15 5106 55014 09300 
31 262 طبعة جديدة من ملخص الموقع الشري» عندما أصبحت يكت 
عمهع5ا27) الشركة التي قامت بتطوير أول متصفح تصويري للعنكبوتية عتطمهمع 
5 776 عاجزة عن دعم ملخص الموقع الشري الذي أنشأته من البداية. 
ونظرا لأن الطبعة الجديدة من ملخص الموقع الثري كانت تستند إلى المواصفة المعيارية 
المسماة بإطار وصف المصادر (“181(1) ع0«1؟اعصمقع1 وملام معوع12 عءسموعجل 
التي وضعها تجمع العنكبوتية العالمية (983600)» كجزء من الهندسة المعمارية للعنكبوتية 
الدلالية؛ تغير المختصر 255 للدلالة على ملخص موقع آردي إف ع1ز5 1001 
03357نا5. لتمييزه عن سلفه ملخص الموقع الثري (2005 ,16©11). والتوظيف أو 
التطبيق البسيط فعلا 55016260 عامتصزة '113له1 معنى آخر للشكل المختصر 
5 تم تطويره بعد طبعة تجمع العنكبوتية العالمية 77736 (2004 ,تعمتيع.1). 

ومقارنة بطرق التخليص الأخرى التي تناولناها في هذا القسم» فإن ملخص 
الموقع الثري يتم إنجازه آليا على العنكبوية. وتلبي هذه الخاصية الآلية على نحو ملائم؛ 
احتياجات كثير من المستفيدين النهائيين» الذين يرغبون في الاطلاع على أحدث 
المغلومات» من ناحية» إلا أن جودة معلومات الملخص الذي يقدمه ملخص الموقع 
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الثري» من ناحية أخرى أدنى مستوىء ولاشك من معلومات طرق التخليص 
الأخرى. كالمستخلصات على سبيل المثال. والقدرة التمثيلية 212119612655ء5ع7معء5 


أحد المعايير التي عادة ما تستخدم في الحكم على جودة التلخيص. 
قضية القدرة التمثيلية: 

جميغ الأشكال الأربعة المختلفة للتلخيص. المستخلصات,. والملخصات» 
والمقتطفات» وملخص الموقع الثري» وسائل معترف بها لتمثيل المعلومات. إلا أنها كما ' 
ميق أن بيناء تختلف فيا بينها من حيث مدى التمثيل 5607562]861560655. 
وبترتيب هذه الوسائل الأربعة بناء على هذا المعيار» يمكن للمستخلصات أن تتربع 
على القمة» بين| يبدو ملخص الموقع الثري متمتعا بأقل قدرة تمثيلية في هذه المجموعة. 
ويمكن للملخصات والمقتطفات أن ترد في مرتبة وسط بين الوسيلتين الأخريين. 
وعلى الرغم من إيجاز هذه المقارنة» فإنها تلقي بعض الضوء على سبل تطبيق أي من 
طرق التلخيص. على أفضل وجه. لمختلف مهام تمثيل المعلومات. 


الطرق الأخرى لتنظيم المعلومات: 
إذا ما نظرنا إلى التكشيف والتقسيم الفئوي والتلخيصء. بوصفها طرقا تقليدية 
.لتمثيل المعلومات أو تنظيمهاء فإن الأساليب التي تحظى بالمناقشة في هذا القسم فريدة 


وغير معيارية. 
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الاستشهادات المرحعية: 

الاستشهادات المرجعية 1085)ه ا هي الإشارات أو الإحالات يععمعمع]ءم 
التي يسجلها المؤلفون عندما يؤلفون أعالههم. ويدل الاستشهاد المرجعي بوجه عام؛ 
على وجود علاقة بين جزء من الوثيقة المستشهد بها أو كلهاء وجزء من الوثيقة التي 
يرد بها الاستشهاد أو كلها (1968 ,0/48[12. ومنذ أن أدخل يوجين جارفيلد 
4 1118656 مؤسس معهد المعلومات العلمية عاكتاصعكء5 م1 1 
10 الذي ينشر كشافات الاستشهاد المرجعي علصا دملواق. هذا 
النهج الجديد إلى مجال تنظيم المعلومات واسترجاعهاء تركز قدر كبير من المناقشات 
عل فك قر دلآلة الاتعمهاة الرجفي: التق سن أسْيات تسيجيل 
الاستشهادات. وحاول جارفيلد عام 2١9764‏ تلخيص أسباب تسجيل الاستشهادات 
المرجعية؛ في حمس عشرة نقطة» تشمل على سبيل المثال الإعراب عن الولاء للرواد 
والاعتراف بالأعمال ذات الصلة بالعمل الجديد (1965 ,1156[0ة )0 . 


وعلى الرغم من أن الدافع الحقيقي للاستشهاد بأعمال الآخرين؛ قد يختلف من 
شخص لآخرء فإنه من الممكن النظر إلى الاستشهادات المرجعية» بوصفها ما يختاره 
المؤلفون الذين يسجلون الاستشهادات المرجعية» لتمثيله في أعالهم. ويتخذ التمثيل 


ليق راجع أيضا في ذلك: 

٠‏ حشمت قاسم. كشافات الاستشهاد المرجعي وإمكاناتها الاسترجاعية. المجلة العربية 
للمعلومات» مج؟»ع4؛ يونيو .198٠‏ وأعيد النشر في: حشمت قاسم. دراسات في علم 
المعلومات. ط؟. القاهرة» دار غريب» 2١9446‏ ص ص 707-170 

٠‏ حشمت قاسم. تحليل الاستشهادات المرجعية وتطور القياسات الوراقية. المجلة العربية 
للمعلومات» مج"اءع6؛ ديسمبر .١198٠‏ وأعيد النشر في: حشمت قاسم. دراسات في علم 
المعلومات. ط ؟. القاهرة؛ دار غريب» ١9496‏ ص ص 1517-1177 . 
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في هذا السياق شكل الاستشهادات المرجعية» لا البدائل العادية كالمستخلصات 
والمصطلحات الكشفية. والاستشهادات المرجعية, في الحقيقة معلومات وراقية 
(ببليوجرافية) حول الوثائق» يمكن تحليلها إلى عناصر كالعناوين وأساء ا مؤلفين. 
وبعبارة أخرىء فإن الاستشهادات المرجعية تكفل مصدراً ثرياً لتنظيم المعلومات. 
وفضلا عن ذلك لا تدعو الحاجة إلى ابتكار إطار (كالمكنز أو خطة التصنيف على سبيل 
المثال) لأغراض التنظيمء بين| لا يمكن الاستغناء عن مثل هذا الإطار في التصنيف 
. والتكشيف باللغات المقيدة. 


والمؤلفون الذين يسجلون الاستشهادات المرجعية: إنم| هم في الواقع يكشفون 
أعماللهم بمصادر متاحة بسهولة» وهي على وجه التحديد الإشارات أو الاستشهادات 
المرجعية. إلا أن الاستغناء عن الوسطاء في تكشيف الاستشهادات المرجعية» له آثآره 
الإيجابية والسلبية على تنظيم المعلومات أو تمثيلها؛ أما التأثير الإيجابي فهو أن المؤلف 
بوصفه المكشفء يعرف عمله على أحسن وجه؛ ولا يحتاج إلى بذل أي جهد لتفسير 
الوثائق الأصلية؛ وأما التأثير السلبي فهو أن المبرر الحقيقي للاستشهاد لحي غير 
معروف في الواقع. وهذا فإننا يمكن أن نتساءل دائم ما إذا كانت الاستشهادات 
المرجعية المناسبة قد استخدمت فعلاً لتمثيل وثيقة ما. وهناك داع آخر لأن نتتخوف من 
تكشيف الاستشهادات المرجعية بوصفه طريقة لتنظيم المعلومات» وهو قصور تغطية 
مراصد بيانات الاستشهاد المرجعي. فالباحثون عادة ما يفيدون من مثل هذه المراصد» 
لأن إعداد مرصد من الصفر غالبا ما يبدو أمزا غير عملي ومبدداً للوقت إلى حد بعيد. 


(*) ربها كان من الممكن هنا القول بأن هناك فتتين من طرق تنظيم المعلومات؛ الطرق الصريحة 
أكنام:ظ المألوفة كالتصنيف والفهرسة الموضوعية والتكشيف. والطرق الضمنية غءتامصذ 
كالاستشهاد الم جعي . (المترجم) 
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ونظرا لأن تكشيف الاستشهادات المرجعية يتطلب القليل من الذكاء البشري» 
فإنه يمكن للعملية برمتها أن تتم آليا بسهولة. والواقع أنه يمكن لعملية تكشيف 
الاستشهادات المرجعية أن تتم كاملة دون أني تدخل بشريء الأمر الذي يبدو غير 
قابل للتحقيق بالنسبة للطرق الأخرى لتنظيم المعلومات. 
التسلسللات: 

بينما يمكن للاستشهادات المرجعية أن تقوم مقام البدائل بالنسبة للوثائق 
الأصلية» فإن التكشيف التسلسلي (1986 بد؟5ة©) عسمتوعلمذ وسمتسوكث نج آخر 
لتنظيم المعلومات. ويمكن للتسلسلات أن تكون عبارات؛ أو مجموعات من 
العبارات» أو عا أهع112هاك ويتم إعدادها جميعا لتمثيل وثيقة ماعنئ وجه 
التحديد '“فاستخدام العنكبوتية العالمية للتعلم اللامركزي في التعليم العالي 04 1056 
دمتأمعسلء ععطوئط ص مستدموع1 لعأسطتنكتل م2 طعى عل1؟ 10م . مثال 
هذه التسلسللات. 

وهناك أنواع مختلفة كثيرة من الكشافات التسلسلية» إلا أنها تتقاسم فيا بينها 
خاصتين رئيستين: )١(‏ صياغة سلسلة لتلخيص موضوع وثيقة ما يدوياء و(1) توليد 
مداخل كشفية آليا اعتهادا على التسلسل المحدد لأغراض التنظيم. ولهذا فإن التكشيف 
التسلسلي حالة متميزة للتكشيف الآلي» الذي عولج بإيجاز في ”/ /١‏ 7. 


(*) استعملت المؤلفة هنا كلمة ك8هف5؛5. مرادفا لكلمة قهؤهده التي ارتبطت تقليديا هذا الشكل 
من الكشافات 5ع دعسا متقطء. (المترجم) 
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و نظام كشاف السياق المصون 25ع535]1 12062 التعاصمء 290ء5و 2111 
(بريسيز 2)51818)015 ونظام تكشيف العبارات المسورة ع785ط 0ع]وع21 
53510 وصلتدء0ه1 (نفيز 7/121115): اثنان من أشهر النظم التي تطورت 
للتكشيف التسلسلي؛ ففي كلا النظامين» يتم أولا إعداد تسلسلات بواسطة مكشف 
بشري. وكشاف البريسيز مستخلص مصغر محمّل بمصطلحات التكشيف المناسبة» 
وكشاف نفيز عبارة موجزة لتكشيف وثيقة ما. ثم يتم بعد ذلك تشفير أو ترميز 
4 هذه التسلسلات لبيان أي المصطلحات يمكن أن تكون نقاط وصولء وإقرار 
مكونات المداخل الكشفية. ويمكن لخوارزميات العرض الفعلية» التي تستخدم في 
كل نظام من نظم التكشيف التسلسلي» أن تختلف اختلافا بينا. إلا أن جميع المهام الآلية 
في التكشيف التسلسلي» يمكن معالجتها على نحو فعال بالوسائل الآلية. 

ويؤدي تكامل التحديد البشري لتسلسلات التكشيف. مع المعالجحة التي تتم بواسطة 
الحاسب لأشكال عرض الكشافات» إلى جعل التكشيف التسلسلي طريقة لتنظيم 
المعلومات لها جاذبيتها. فمثل هذا التكامل يحافظ على الجودة المرتبطة بالتكشيف البشريء إذ 
يتكفل البشر بإعداد تسلسلات التكشيف. من ناحية» ومن ناحية أخرى يمكن للتكشيف 
التسلسلي أن يحول دون الاستياء المرتبط بالطرق اليدوية المثبرة للضجر غير المطردة المفتقرة 
إلى الكفاءة. ومهم| يكنء فإن العصر الرقمي قادم بسرعة:؛ ومن المتوقع للحاسبات أن تنهض 
بدور متزايد الأ*مية» في تنظيم المعلومات واسترجاعها على السواء. 


مراجعة للطرق الرئيسة لتنظيم المعلومات: 


هناك» كا تبين لنا في الأقسام السابقة» طرق متعددة لتنظيم المعلومات. ويلخخص 
الجدول رقم ١/7‏ طرق التنظيم الرئيسة التي ناقشناها حتى الآن» من حيث نوع التنظيم؛ 
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والكيانات التي يتم تنظيمهاء وإطار التنظيم (ما إذا كان يعتمد على لغة مقيدة) فضلا عن 
طريقة الإنتاج. ولكل من هذه الطرق مظاهر قوتها ومواطن ضعفها. وعندما يقع الاختيار 
على طريقة بعينها لتنظيم المعلومات» كم يبين ميدو (1992) 84680077 فإنها ينبغي أن 
تحقق ما يلي: 

() تميز بين مختلف الكيانات» (7) تتحقنق من الكيانات 


المتشاممة» فرق تكفل الوصف الدقيق للكيانات» (5) متمحد من 


الجدول رقم ١/7‏ طرق تنظيم المعلومات 
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وكا هو متوقع» فإنه لا يمكن لطريقة بعينها أن تلبي الشروط التي حددها 
ميدو كاملة. ويمكن لموطن الضعف في طريقة ما أن يكون مظهر قوة في غيرها؛ 
فالتكشيف وحده على سبيل المثال» لا يمكن أن يكشف عن جوانب معينة للوثيقة. 
بين| يقصد بالاستخلاص تمتيل وثيقة ما بكاملها. ولذاء فإن الجمع بين الطرق (أي 
استخدام أكثر من طريقة واحدة) هو الخياز» عندما يحتاج المرء للاختيار من بين الطرق 
اندوع تنكل للعلوما كاوق النطيق سمل ديع لخدا وخدوعة من طرق 
التنظيم (كالتصنيف مثلا مع الاستخلاصء أو التلخيص مع التكشيف). ويتزايد 
استخدام الطرق الناشئة كملخص الموقع الثري 1855 مثلاء والتمييز 188ع8ها. لتلبية 
الاحتياجات المتغيرة لتنظيم المعلومات في العصر الرقمي. 
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الفصل الثالث 
تنظيم المعلومات *: الموضوعات ذات الصلة 


ناقش الفصل الثاني الطرق الرئيسة لتنظيم المعلومات أو تمثيلهاء مع التركيز على 
التطبيقات التقليدية وتنويعاتها وامتداداتها. ونستكشف في هذا الفصل الموضوعات 
الأخرى المتصلة بتنظيم المعلومات؛ بها في ذلك ما وراء البيانات» والنصوص الكاملة 
وتنظيم الوسائط المتعددة. 


ما وراء البيانات: 


ما وراء البيانات 111820218 مصطلح تم سكه في نباية تسعينيات القرن 
العشرين» للدلالة على تلك التوصيفات التي تعد على وجه التحديدء لتنظيم 
المعلومات الرقمية التي يمكن الوصول إليها على الونترنت. وقد تم تطبيق ما وراء 
البيانات في البداية على المصادر الإلكترونية؛ والمعلومات المرتبطة بالشبكات دون 
غيرها. وقد اتسع مفهوم المصطلح ليشمل جميع تطبيقات تنظيم المعلوماتء لأن ما 
وراء البيانات أصبح مصطلحا متداولا إلى حد بعيد» كما أن دور الإئترنت كمنصة 
للوصول إلى أنواع شتى من المعلومات في نمو مستمر. 


ماذا يقصد بما وراء البيانات؟ 


من الممكن الآن تعريف ما وراء البيانات بطريقتين؛ أولاهما أكثر تحديدا في 
مجالماء وتعنى التوصيفات التى تتوافر للمعلومات المرتبطة بالشبكات والمصادر 
الرقمية» باتباع مواصفة معيارية 5880850 أو إطار 158126970:16 (كبؤرة دبلن 
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ع:00) ستاطنا<طآ على سبيل المثال)» يتم إعداده لهذا الغرض على وجه التحديد. 
والتعريف الآخر أكثر اتساعا في مجاله» ويشمل بيانات الفهرسة والتكشيفء التي يتم 
إعدادها لأي نوع من الوثائق» باستخدام الطرق التقليدية» من أجل وصف المعلومات 
وتنظيمها. ومبذا المعنى» فإن بيانات الفهرسة التي يتم إعدادها بتصنيف ديوي 
العشري (12100) وقواعد الفهرسة الأنجلو-أمريكية / الفهرسة المقروءة آليا 
01/314120 4ة) على سبيل المثال» ينظر إليها أيضا بوصفها ما وراء البيانات. 

ربكتو لناوراء اينات أن كفيس ار قفد بر استفلة الل لقن بوتديرى 
المستودعات» ومن يقومون بالتجهيز كطرف ثالث (1998 ,لإاعع]8 #ه نوعوممه12). 
ويمكن لبعض معلومات ما وراء البيانات أن تكون أيضا كامنة في بيئة التنظيم الفائق» 
في شكل تيجان لغة ترميز الننصوص الفائقة (1112341) أو الروابط الفائقة. وعلى 
الرغم من أن ما وراء البيانات توفر أطرا لتنظيم المعلومات» وخصوصا بالنسبة 
للمصادر المرتبطة بالشبكات. بالإضافة إلى الأطر القائمة (كخطط التصنيف وقواعد 
الفهرسة مثلا)؛ء يرى وول (1998) 78001 أن توفير ما وراء البيانات إنما هو في 
الأساسء امتداد لعملية الفهرسة التقليدية. وكا أوردنا بإيجاز في القسم ١/7/7‏ فإن 
عملية الفهرسة التقليدية تبدو غير مجدية بالنسبة لتنظيم المصادر الرقمية على الإنترنت» 
نظرا للخواص الفريدة التي نناقشها في الأقسام التالية. 
خصائص المعلومات الرقمية على الإنترنت: 

للمعلومات الرقمية» مقارنة بالمصادر الورقية» خصائصها التي تميزها. ويتعين 
على المرء الاعتماد على عتاد معين وبريجيات معينة» للاطلاع على محتوى المعلومات 
الرقمية. يضاف إلى ذلك أن المعلومات الرقمية ينبغي أن تكون مسجلة بنوع من 
الصيغ 6057084 التي تتغير دائم| كلم| ارتفع مستوى العتاد والبرمجيات أو تطور. 
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وأحيانا ماتكون الطبعات المختلفة من البرمجيات نفسها متوافقة» إلا أنها لا تكون 
كذلك في الغالب الأعم. وتصبح قضية التوافق أسوأ حالاً» إذا كان المرء يتعامل مع 
معلومات رقمية ناشئة بحزم بر مجيات مختلفة. 


وفضلا عن ذلك. فإن المعلومات الرقمية على الإنترنت» عادة ما تسجل في 
شكل تنظيم فائق» يتناقض بحدة مع التنظيم المسطح للمعلومات الورقية. وييسر 
ظهور الإنترنت» على الإنسان التواصل وتقاسم المصادر إلا أن غياب تقنيات ضبط 
الجودة على الإنترنت يسفر عن فيضان من المعلومات التي 3 تتمتع بدرجات متفاوتة من 
الجودة. ولهذا فإنه ينبغي اتباع طرق مختلفة لوصف وتنظيم المعلومات الرقمية على 
الإنترزنت ت؛ نظرا لأن المواصفات المعيارية (كتصنيف ديوي العشرى 810» وقواعد 
الفهرسة الأنجلو-أمريكية/ مارك / ©1/1414 /446012) قد وضعت قبل إنتاج 
المعلومات الرقمية بكميات ضخمة» مصممة في المقام الأول لتنظيم المعلومات 
الورقية. وقد ظهرت ما وراء البيانات لمجرد التعامل مع مشكلة تنظيم المعلومات 
الرقمية» التي تصاغ 1055084160 بطريقة فريدة» وتتسم بالتغير المستمر» وتفاوت 
الجودة؛ وضخامة الكم. 
أمثلة للمواصفات المعيارية لما وراء البيانات: 


على الرغم من أن مفهوم ما وراء البيانات جديد نسبيا في مجال تنظيم 
المعلومات». فقد تم وضع عدد كبير من المواصفات المعيارية لما وراء البيانات» كما أن 
هناك الكثير في الطريق. وبؤرة دبلن (1000) ع:00) صنتاطنا2ط؛ وإطار وصف المصادر 
01ل18) عم تعصصمم1 سمتامتعوع12 عع ناووع 1 بعض أمثلة المواصفات 
المعيازية لا وواء البياثانت: 
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بؤرة دبلن: ٠‏ 

وبؤرة دبلن 190 أنموذج بسيط لوصف المحتوى بالنسبة للمصادر الإلكترونية 
(1997 ,ا»طأ99). وبؤرة دبلن جهد مشترك بين خبراء في مجال المكتبات» 
ومجموعات البحث في المشابكة والمكتبات الرقمية؛ ومجموعات متعددة من 
اختصاصيي المحتوىء في سلسلة من ورش العمل المتفرقة؛ القائمة على دعوة 
المشاركين فيها» تسمى سلسلة ورش عمل بؤرة دبلن «مطىطه'178 ع0 ن) ستاطسج]1 
15. وتتكون بؤرة دبلن من خمسة عشر عنصراء هي العنوان» والمنشئ 
والملوضوعء والوصفه والناشرء والمساهمء والتاريخ» والنوع. والصيغة. 
ومحدد الهوية» والمصدرء واللغة» والعلاقة» والتغطية» والحقوق. وكام بين وايبل 
(1997) اعطاء لآ 


فإن بؤرة دبلن لم يقصد بها أن تحل محل نهاذج الوصف 
الأكثر ثراءء» كالفهرسة بقواعد الفهرسة الأنجلو-أمريكية / 
مارك» وإنما لتوفر مجموعة بؤرية من عناصر الوصفء التي يمكن 
البسيط للمصادر. 6.9 
وتستخدم بؤرة دبلن عملياء.في المقام الأول» لتوفير توصيفات بسيطة للمصادر 
الشبكية» كمواقع العنكبوية على سبيل المثال. ويبدو أنها أشهر مواصفة معيارية من بين 
جميع نماذج ما وراء البيانات. وفضلا عن ذلك. فإن بؤرة دبلن هي الأنموذج الميدئي 
0045م الذي أعطى دفعة لتطوير إطار وصف المصادر 1021؛ في تجمع 
العتكبوتية العالمية (13600) 33نا501)1هه) 5ع11 77106 7]010. ويرتبط القاكمون 
وصف المصادر. 
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تطور إطار وصف المصادر برعاية تجمع العنكبوتية العالمية؛ إذ أصبح إحدى 
توصيات هذا التجمع.ء في فبراير عام 2١144‏ ثم أصبح بعد ذلك مكونا رئيسا في 
العنكبوتية الدلالية» التي وضع تصورها بيرنرز-لي ع©8613655-1 والعاملون معه 
,لالق8 باآمطلهط5 :2001 يهاللوعةط!ا © ,مع1[لصع8 ربععاءوعوعءظ8) 
(2006 وعع.آ-18615 8 على سبيل المثال. ويشتمل القسم 57“ عل مناقشة 
كتوق اللالالة مع منظور عطع الكلومات ولمنواعها وك وك قياف 
(1998) 51291 
فإن إطار وصف المصادر بنية أساس لتشفير 2200188» أو 
ترميز ما وراء البيانات ونمذجتها وتيادلها. وإطار وصف المصادر 
في جوهره. أنموذج ثلاثي الأبعاد بسيط: فا وراء البيانات تتعلق 
بمصدر ماء وللمصدر خاصية واحدة أو أكثرء ولكل خاصية 
قيمة. (21 .م) 
ويستخدم إطار وصف المصادر لغة الترميز القابلة للتوسع عاطأومعامء 
(141) عع قتاعصمآ منعاآ:813 يبوصفها نظم قال[ النقل. ويتم تطوير إطار 
وصف المصادر لدعم الكثير من احتياجات ما وراء البيانات المختلفة؛ للمتعهدين 
وموردي المعلومات (1997 و[ع78715). ولا يتكفل إطار وصف المصادر بالدلاللات» 
وإنما يكفل قدرة كل وسط أو تجمع لوصف المصادره على تحديد معالم نظام دلالي يعبر 
عن متطلبات ذلك الوسط أو التجمع. وبعبارة أخرى» فإن إطار وصف المصادرء على 
عكس بؤرة دبلن» لا يحدد دقائق مواصفات العناصر المعينة التي ينبغي أن يتتضمنها 
الإطارء وإنا يكفل لمن يستخدمونه حرية اختيار معالم المواصفات وتحديدها في حدود 
إطارهم» بناء على احتياجاتهم. ومن ثم فإن إطار وصف المصادر يشكل أساسا لتجهيز 
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ما وراء البيانات. وى] ذهب لاسيلا (1997) 1,3585118 فإن إطار وصف المصادر 
يمكن أن يستخدم في مجالات تطبيقية عدة؛ في اكتشاف المصادرء على سبيل المشال» 
لدعم قدرات محرك البحثء وفي الفهرسة لوصف المحتوى وعلاقات المحتوى المتاحة 
على موقع عنكبوتية بعينه» أو صفحة عنكبوتية بذاتهاء أو مكتبة رقمية بعينها. ويشتمل 
القسم 7/17/ ١‏ على المزيد من المعالجة لإطار وصف المصادرء في سياق النظر في 
الحقدسة المعزازية للغتكبوتية الذلالية: 
محدد هوية الكيانات الرقمية: 
على عكس كل من بؤرة دبلن» وإطار وصف المصادرء فإن محدد هوية الكيانات 
الرقمية (001) 1156مء10 )عءزط0 اهائع21 يوضح معالم الكيانات الرقمية كلا 
على حدة (كمقالات الدوريات» ومقاطع الفيديوء والمقطوعات الموسيقية على سبيل 
المثال) بخطته المحددة الخاصة. والمؤسسة الدولية لمحدد هوية الكيانات الرقمية 
(2009) صو نج كصناه7 201 [8هه4 1202 منظمة تأسست لتطوير وإدارة نظام 
محدد هوية الكيانات الرقمية» وتبين في صفحتها الرئيسة (0993838.001058): 
لقد قصد بنظام محدد هوية الكيانات الرقمية لهاأع151 
دع ]535 (1001) 1م10 أعءزط0). تحديد هوية كيانات 
المحتوى في البيئة الإلكترونية. ويتم تخصيص أو تعيين أسماء محدد 
هوية الكيانات الرقمية لأي كيان» للاستعمال على الشبكات 
الرقمية. وتستخدم هذه الأسماء لتوفير معلومات حديثة» تشمل 
أماكن العثور عليها (أو على معلومات حوها) على الإنترنت. ومن 
الممكن للمعلومات المتعلقة بكيان رقمي ما أن تتغير من وقت 
لآخر» بها في ذلك مكان العثور عليه إلا أن اسم محدد هوية الكيان 
الرقمي لا يتغير. 
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ويتكون نظام محدد هوية الكيانات الرقمية من ثلاثة أجزاء؛ هي محددات 
لمهوية» والدليل» ومرصد بيانات نظام محدد هوية الكيانات الرقمية. ويضم كل محدد 
للهوية صدراً أو سابقة 54م وععجزا أو لاحقة أو كاسعة #كتاى» يفصل بينه| 
شرطة تميل لليسار 51851 0ه (/ ). ويتم تعيين أو تحديد الصدرء الذي يعرف 
أيضا بمحدد هوية الناشر (11 © طاوتاطنام» من قبل وكالة تسجيل محددات هوية 
الكيانات الرقمية للناشرين» أما العجز الذي يسمى أيضا محدد هوية المادة 10 تدعكل ., 
فيعين أو يحدد من قبل الناشر (2007 ,78888). وبنية محدد هوية الكيانات الرقمية 
وتعيبنه يشبهان. في الجوهر بنية وتعيينا لرقم المعياري الدولي للكتاب 
15110 ءطتصساظ عاممظ8 0م لسماك لهمملن دهع )م1 )» والر قم المعياري الدولي 
للدورية (15517 ناء سسا لوتع5 0عمل سماد تمده أمصعء1ه1). هذان النظامان 
اللذان يستخدمان منذ سبعينيات القرن العشرين» للتحقق من هوية الكتب 
والدوريات» على نحو لا لبس فيه. يضاف إلى ذلك أن نظام محدد هوية الكيانات 
الرقمية يستخدم دليلا مركزيا لتدارك المشكلات المتعلقة بتغيرات ملكية المحتوى 
الرقمي وأماكنه. ويتم اختزان المعلومات المتعلقة بالكيان الذي تحدد هويته في مرصد 
بيانات نظام محدد هوية الكيانات الرقمية (2004 رصسهتكوعل عت علهلل). 

وهناك خاصتان تميزان محددات هوية الكيانات الرقمية عن جميع طرق تنظيم 
المصادر الرقمية؛ أولاهما أن محدد هوية الكيان الرقمي يمكن تطبيقه للكيان الرقمي 
بكامله (كالدورية التخصصية على سبيل المثال) أو أي جزء منه (كالقسم, أو الشكل 
التوضيحي. أو الجدول على سبيل المثال) على السواء. وتكفل خاصية تطبيق محدد 
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هوية الكيان الرقمي هذه بالمعنى الحرفي» تنظيم المعلومات على أي مستوى من 
التحليلء الأمر الذي نادراً ما يتحقق في المجالء إلا أن له مضامينه الإيجابية بالنسبة 
لاسترجاع الفقرات. أما الخاصية الثانية فإن محدد هوية الكيان الرقمي يتسم بالثبات 
والاستقرار والاطراد؛ بمجرد أن يسجل ويعين» في ربط محتواه بالدليل الذي دائما ما 
يشتمل على المكان الراهن لذلك الكيان الرقمي» بصرف النظر عما إذا كان سلفه يمكن 
أن يتغير أو يختفي من الإنترنت. 5 

ولا يكفل نظام محدد هوية الكيان الرقمي نبجا بديلا لتنظيم المعلومات فحسب» 
وإنما يتيح إمكانية الوصول السلس إلى الكيانات الرقمية التي يتم التحقق من هويتها. 
ومن أمثلة تطبيق محددات هوية الكيانات الرقمية؛ منظمة كروسرف 
أ 2020) (777799.010551”©101:8): وهصي منظمة غير ربحية؛ تضم دو رالنشر 
والمكتبات» تبدف إلى ربط المستفيدين» عن طريق محددات هوية الكيانات الرقمية» 
بالمحتوى البحشي الأولي كالكتبء ومقالات الدوريات» وأعمال المؤتمرات. ويقوم 
الناشرون المرتبطون بكروسرف بتعيين محددات هوية الكيانات الرقمية لكل مادة 
ينشرونهاء ويمكن للمستفيدين يدورهم الوصول إلى تلك المواده عن طريق روابط تحديد 
هوية الكيانات الرقمية. 

إلا أن نظام محدد هوية الكيانات الرقمية يبدو أقرب إلى تقنية الربط الدائم 
الموحدة منه إلى المواصفة المعيارية لما وراء البيانات» وذلك لأن كل محدد لهوية 
الكيانات الرقمية يرتبط بسلسلة تماوراء البيانات» بالإضافة إلى تجموعة من 
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المعلومات الوراقية والتجارية المتصلة بمحتواه (كالعنوان, والمؤلف. وتاريخ النشرء 
والسعرء على سبيل المثال). وعندما يتم تحويل معلومات محدد هوية الكيانات الرقمية 
إلى الناشرء فإنه 58 عن متحدد هوية الكيانات الرقمية في بياناته الوراقية» ويعثر على 
المحتوى عن طريق معلومات الربط المختزنة في الدليل المركزي. ومن ثم يمكن 
للمحتوى الرقمي أن يظهر للمستفيد على شاشة الحاسب. 

وقد تم تطوير مواصفات معيارية أخرى لما وراء البيانات»؛ أو في سبيلها 
للتطوير لوصف المعلومات الرقمية على الإنترنت. وقد أجرى زنج وكين 800 268 
(2008) 0128 دراسة وصفية تحليلية شاملة للمواصفات المعيارية الحالية لما وراء 
البيانات» وقس) هذه المواصفات إلى ثاني فئات (المواصفات ذات الأهداف العامة» 
والمصادر الثقافية والبصرية» والأرشيفات والمحفوظات).. وهناك تزايد في الحاجة إلى 
المواصفات المعيارية لما وراء البيانات هذه وكذلك الحال أيضا بالنسبة للمخاوف 
والتساؤلاات. 
بعض التساؤلات والمخاوف حول ما وراء البيانات: 

يتم إنشاء ما وراء البيانات» ا سبق أن بيناء من أجل وصف المصادر الرقمية 
وتنظيمها ني الأساس. إلا أنه فيا يتعلق بطبيعة المعلومات الرقمية أو مصادر 
الإنترنت» ما جدوى ما وراء البيانات؟ ففي البيئة الورقية تتم فهرسة كل مطبوع 
تضمه مجموعات المكتبة. وفيا يبدو فإن الأسلوب نفسه غير قابل للتطبيق بالنسبة 
للمعلومات الرقمية على الإنترنت؛ نظرا للأسباب التي سبق ذكرها. ويطفو على 
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السطح أيضا تساؤل ممائل: من يمكن أن ينشئ ما وراء البيانات» في ظل الكميات 
الضخمة. والجودة غير المؤكدة للمصادر المرتبطة بالشبكات؟ 


ويتوقف توقع دورة حياة المعلومات الرقمية» إلى حد بعيد» على توافر التقنيات 
(كالعتاد والبرمجيات على سبيل المثال) التي تستخدم لأغراض إنشاء المعلومات 
والوصول إليها. ولما كانت تقنيات المعلومات تتطور بسرعة؛ فكيف يمكن أن نضمن 
للمصادر الرقمية» نمجرد وصفهاء أن يتم العشور عليها واسترجاعها في جميع 
مراحل حياتها؟ 


وف البيئة الورقية» يظل محتوى أي مطبوع كما هو إلى أن تصدر منه طبعة 
جديدة. أما في البيئة الرقمية» فإن محتوى أي وثيقة يمكن أن يتغير باستمرار. إذن» 
كيف نتعامل مع المحتويات الديناميكية لكثير من هذه المصادر» عندما نحاول توفير ما 
وراء بيانات لما؟ 


وكا سبق أن ناقشناء فإن هناك مواصفات معيارية لما وراء البيانات» لتنظيم 
المعلومات الرقمية على الإنترنت. ولدينا في الوقت نفسه مواصفات معيارية كتصنيف 
ديوي العشريء وقواعد الفهرسة الأنجلو-أمريكية/ مارك» التي كنا نستخدمها على 
مدى سنوات» لوصف المصادر الورقية. والآن» كيف يمكن استيعاب ما وراء 
البيانات ني الأطر القائمة الأخرى؟ وقد أشار دمبسي وهيري 800 "زءوصدمء12 
(1998) لودع إلى أن مجتمع المكتبات قد بدأ توا ينظر في سبل وضع ما وراء بيانات 
"عالم الكتاب" » وما وراء بيانات “الشبكات” في سياق الاستخدام نفسه. ومن بين 
مثل هذه المحاولات جهود أوسي إل مي :0001.0 في الارتقاء بتصنيف ديوي 
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العشري» بأدوات مثل صائغ الكلمات طانتم005: الذي يقتطف المفاهيم 
والمصطلحات الجديدة والناشئة» من نصوص غير مقيدة» ويربطها بتصنيف ديوي 
العشري (1997 ,وتناع0)-عصذيا7؟). 


وبالإضافة إلى ما تمت معالحته هنا بإيجاز. تظل قضية القابلية للتشغيل التبادل 
17 التطمعع ممع 11 في صميم حركة ماوراء البيانات وع1[):ه8 عت «وع01) 
(2008. وتدل القابلية للتشغيل التبادل على قدرة نظم أو مكونات متعددة» بمنصات 
وواجهات تعاملء وبنى بيانات مختلفة» على تبادل البيانات وتقاسمهاء بأقل قدر من 
الفاقد في المحتوى والوظيفية (321 .5 ,2008 ,015 :8# 208). وقد تناول زنج 
وتشان (2004) صهطن) 4سه عمع2 على وجه التحديد, قضايا في دعم القابلية 
للتشغيل التبادل» بين نظم معالجة المعرفة» التي غالبا ما تستخدم لإنشاء ما وراء 
البيانات. ويبدو أنه ليس من السهل تحقيق القابلية للتشغيل التبادلي» على الرغم من 
بذل جهود ضخمة في ذلك الاتجاه. يضاف إلى ذلك أن لكل مواصفة من مواصفات 
ما وراء البيانات قضاياها ومخاوفها المرتبطة مها دون سواها؛ ولنأخذ محدد هوية 
الكيانات الرقمية 1801 كمثال (2007 ,58ة98): أي من المواصفات المعيارية لما وراء 
البيانات يمكن أن تستخدم عند تعيين محددات هوية الكيانات الرقمية؟ هل يمكن 
تعيين محددات مختلفة لهوية الكيانات الرقمية» لكل شكل ولكل طبعة؟ 

ولا تشمل التساؤلات والمخاوف التي أحصيناها هنا بحال» جميع التحديات 
التي نواجهها في تنظيم المعلومات الرقمية على الإنترنت» بنهج ما وراء البيانات. 
وفضلا عن ذلكء فإنه ليست هناك خطة عامة للتعامل على وجه التحديد, مع هذه 
التساؤلات والمخاوف. والوصف الانتقائي» والتجديد المجدول زمنياًء والحفظ 
الأرشيفي المخططء من بين المارسات الراهنة المتبعة في توفير ما وراء البيانات 
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للمصادر الرقمية. وما وراء البيانات» مهما كان من الممكن للممارسات الراهنة 
والمستقبلية أن تتغير» إن| قصد ها في النهاية تيسير تنظيم المعلومات الرقمية» بحيث 
يمكن أن تسترجع في| بعد على نحو أكثر فاعلية. 


النصوص الكاملة: 


عندما كان حيز اختزان الحاسبات ثميناء ووقت استخدامها باهظ التكلفة» لم 


كبو نك سوق دا روات رداك سرس كاله وك الرمييت البززاى 
والتكشيف على سبيل المثال) أن تختزن رقميا لأغراض الاسترجاع. أما اليوم,؛ فإنه 
يمكن لحاسب شخصي عادي أن يكون قوياء من حيث حيز الاختزان وطاقة المعالجة 
الإلكترونية. ولم يعد اختزان النصوص الكاملة واسترجاعهاء في العصر الرقمي» من 
المارسات النادرة. 


تنظيم معلومات النصوص الكاملة: 


تنظيم معلومات النصوص الكاملة التي تختزن رقمياء من نتائج تطور تقنيات 
المعلومات ولاشك (1992 ,381680077). إلا أن تنظيم النصوص الكاملة لاهو 
”اعتبار كل كلمة بمثابة واصفة“ (1993 ,ظطةتطعنا1) ولا هو ”لاضرورة: 
للتكشيف“. فالأمر يتطلب تنظيها خفيا ©51515[1ه1 أو ضمنيا أو مطمورا 
64 .». خلاف النصوص الكاملة نفسهاء لكي تكون المعلومات قابلة 
للاسترجاع. ويتقاسم تنظيم النصوص الكاملة معظم خواص التكشيف الاشتقاقي» 
بإتباع قائمة الكلمات المستبعدة 156[ 77050 مق بالإضافة إلى رد الكلمات إلى 
جذورها 8تنفسصتتدعؤو. والأساليب الماثلة. وما هذا النهج سوى ما أسماه لون سطنارآ 
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تكشيف الكلمات المفتاحية» الذي يمكن أن يتم آليا في العادة. وتستخدم نظم 
استرنجاع الإنترنت الشهيرة» مثل جوجل 00816)» طريقة تكشيف الكلات المفتاحية 
صعوبات تنظيم النصوص الكاملة: 


بين| يبدو تنظيم النصوص الكاملة مرغوبا فيه من جائب المستفيدين» فإن 
الناتج غالبا ما يكون مختلطا ومغرقاً» نظراً لمشكلة التحقيق المنخفض. ويمكن للمثشال 
الملائم أن يكون النتائج التي تسترجعها معظم نظم استرجاع الإنترنت؛ فغالبا ما 
يسترجع البحث بالكلمات المفتاحية في العنكبوتية العالمية» عدة آلاف من المواقع على 
الأقل» لا يمكن إلا لعدد قليل منها فقط أن يكون صالحا للاستفسار الذي قدم 
للنظام. ويسجل فاحمان (1993) تسقدمعن1: 


يفرض اختزان النصوص الكاملة أعباء ضخمة؛ على وجه 

الخصوص على حيز الاختزان» وعلى وقت البحث أو التنقيب. 

ولا ينطوي العنصر الثاني على استنفاد وقت المعاللجة بواسطة 

الآلات فحسب. وإنها يشمل أيضاء وهذا هو الأهم؛ وقت 

الإنسان وجلبده. اللازمين لتنقية الكم الزائد من الشوشرة 

المسترجعة. (99 .م) 

ولم يعد اختزان النصوص الكاملة» ى] سبق أن بيناء قضية في تنظيم المعلومات 
واسترجاعهاء وذلك بفضل تطور تقنيات استخدام الحاسبات. إلا أن جودة التنظيم 
بالنسبة لمعلومات النصوص الكاملة؛ أبعد من أن تكون مرضية» الأمر الذي يتضح 
دائما في النتائج التي تقدمها معظم نظم استرجاع الإنترنت. وتتوقف الاختراقات 
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المستقبلية في حل هذه المشكلة الجوهرية» في المقام الأول» على البحث في معالجة اللغة 
الطبيعية (8015). وتشمل بعض المهام الجوهرية» التي ينبغي أن يتصدى لا الباحثون 
في معالحة اللغة الطبيعية: )١(‏ إقرار البنيان النظمي عتتتاعن)5 83218116 للجملة 
(مثل: يطير الوقت كالسهم 8508 هه 1116 11165 6م:ة1) ويعرف أيضا بالإعراب» 
و(؟) إقرار معنى كلمة (كالواجب 0143 مثلا) في السياقء أي المعاني المتعددة لكلمة 
ما (1999 ,4طهنصكة). ويحظى موضوع معالجة اللغة الطبيعية بمزيد من المناقشة في 
الفصل الثاني عشر " الذكاء الاصطناعي في تنظيم المعلومات واسترجاعها . 

وعد فا كرن عن الفنعب لوفو إل الكلومنابعة عبر التفمة #الار اماك 
والجداول» من أجل الاسترجاع في نظم معلومات النصوص الكاملة ,مسصقصوت؟) 
(1993 إذا كان التنظيم يتم آليا. ولكنء ماذا عن الأنواع الأخرى من معلومات 
الوسائط المتعددة» كالأصواتء والصور المتحركة. التي تتاح في صيغ رقمية؟ كيف 
يتم تنظيم معلومات الوسائط المتعددة في نظام الاسترجاع؟ ونتناول هذا الملوضوع 


في القسم التالي. 


تنظيم معلومات الوسائط المنعددة: 

هناك تزايد في معلومات الوسائط المتعددة التي يتم إنتاجها في العصر الرقمي» 
كا يجعل ظهور العنكبوتية العالمية الوصول إلى مثل هذه المعلومات أكثر سهولة مما كان 
عليه من قبل. إلا أن تدفق معلومات الوسائط المتعددة بغزارة» يمثل أيضا تحديات غير 


مسبوقة بالنسبة لمجال تنظيم المعلومات واسترجاعها. 
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أنواع معلومات الوسائط المتعددة: 

الوسائط المتعددة هي أي جمع بين الصوت والصورة والمعلومات النصية» 
تشتمل فيه الصور على كل من الصور الثابتة والصور المتحركة. ومن الممكن معاملة 
كلمتي صوتي 501180 وسمعي 811010 بوصفهه) مترادفين» إلا أن هناك ميلا لإحلال 
. مصطلح “سمعي'“ محل “صوتي“. وأحيانا ما تستعمل عبارة الوثائق الناطقة 
كأسعسدء0ك0 مععاومع تلدلالة عل المعلومات النصية المسجلة شفويا (كالأحاديث 
كلها 220 5عطءعءم: على سبيل المثال). وا هو الخال بالنسبة لمعلومات الصور. 
تشمل الصور الثابتة كلا من اللوحات, والصور الضوئية» والملصقات وما شابهها. 
ويمكن للصور المتحركة أن تكون مصحوبة أو غير مصحوبة باللصوت. وعادة ما 
تكون الصور غير المصحوبة بالصوت رسوماً متحركة 841085تصلهة أو أفلاماً 
سينائية صامتة. وتصبح الصور المتحركة المصحوبة بالصوت مقاطع فيديو أو أفلاماً 
سينائية. ويمكن للنصوص أن تظهر في المعلومات الصوتية كتبصرات 
535 ,,:, وني الصور كعناوين أو ترجمات. ويوضح الشكل رقم ١/7”‏ الأنواع 
المختلفة لمعلومات الوسائط المتعددة. 


طريقتان رئيستان للتنظيم: 
لقد كانت الوسائط المتعددة» في| مضى ١‏ عادة ما تنظم يواصفات تعتمكد» على 
سبيل المثال» على اسم المنشئ» وحجم الصورة وعبارات أوعنتاوين فرعية وكلات 


مفتاحية. ومن ثم فإن هذه الطريقة تسمى الاعتاد على الوصنف أو التوصيف 
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850 108)ملتء05.: وظلت على مدى زمني طو يل تستخدم من جانب 
اختصاصيي المكتبات وغيرهم من اختصاصبي المعلومات, لتنظيم الوسائط المتعددة. 
وعلى الرغم من أن التنظيم القائم على التوصيف للوسائط المتعددة» يتعين دائ| أن يتم 
بواسطة البشرء فإن جؤدة النتائج النهائية كانت تتفاوت؛ نظرا لأن الوسائط من بين 
أسباب أخرى» كان من الصعب في بعض الأحيان» وصفها بطريقة صريحة 
وموضوعية. فكيف يمكن على سبيل ال مثال للمرء ٠‏ أن يصف صراحة؛ صورة تشبه 
غروب الشمسء أو مقطوعة موسيقية» تبدو هادئة ومسالمة؟ يضاف إلى ذلك كيف* 
يحقق البشر تنظي| مطردا دقيقا لمعلومات الوسائط المتعددة» عن طريق اتباع هذا النهج 


الذاق عللاعء زطده؟ 


وقد تطور النهج المسمى بالقائم على المحتوى 62560 6050684) أي تنظيم 
الوسائط المتعددة بخواصها المميزة» كلون الصورة» وطبقة الصوت..لتجنب أوجه 
القصور التي تكتنف المنهج القائم على التوصيف. وبناء على التقنيات الرئيسة 
(كالتعرف على الحديث 105)ندعمع»ع7 طاءعءم5. والتعرف على الأنماط معدم 
00 أسمم».» وفهم الصور) التي تستخدم في تحليل الوسائط المتعددة لأغراض 
التنظيم» عادة ما يتبع النهج القائم على المحتوى. من جانب الباحثين في علوم 
الحاسب. كذلك يمثل هذا النهج تغيرا في الإطار النظري الأساس في تنظيم الوسائط 
المتعددة. وإذا ما تم تطبيق تنظيم الوسائط المتعددة القائم على التوصيف. وذلك 
بوصف ”المضاف إليه 06255'' (كاسم المنشئ وتاريخ النشر) و”حيثيات أو 
ملابسأت 40655ن80” الشيء أو محتواه (كالكلمة المفتاحية والموضوع مثلا) فإن 
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التنظيم القائم على المحتوى يتحقق بتحليل خواص الوسائط المتعددة وصفاتباء كلون 
الصورة وطبقة.الصوت على سبيل ال مثال. 


الوسائط المتعددة 


بلدا جل هو 


الوثائق الناطقة 


الصور المتحركة الصور الثابتة 


ري 


الفيديو / الأفلام 2 الأفلام الصامتة 





الشكل رقم ع ١‏ فئات معلومات الوسائط المتعددة 

وخواص الوسائط المتعددة متعددة الأوجه أو الجوانب. وتشمل الخنواص 
المشتركة للصور الثابتة اللون» والشكل» والقوام أو النسيج عدا6ئءة؛ وغير ذلك تما 
يمكن تحليله أيضا بالاتجاهية 163[ه0)ءع01. والعشوائية ووعصدده0صدص. 
والخشونة 5 » والتباين +2©081485) وما شابه ذلك. وبالنسبة للمعلوفات 
الصوتية» فإن الخواص كالطبقة والسرعة أو الإيقاع؛ غالبا ما توضع في الحسبان 
لأغراض التنظيم. ومن الممكن عادة لهذه الخصائص البدائية أو منخفضة المستوى أن 
تستخلص آلياء أو بطريقة نصف آلية» الأمر الذي يلغي الحاجة إلى المشاركة البشرية 


129 


باهظة التكلفة» وإن لم تكن مجزية دائماء في عملية التنظيم. ومن الممكن النزول 
بمستوى الخصائص بالنسبة لمعلومات الفيديو إلى تلك الخاصة بالصورة الثابتة 
والصوت. بعد عملية التقطيع أو التعجزئ التي نتناوا في 7/ 7/7 


ومن بين هذين النهجين المتميزين لتنظيم الوسائط المتعددة» أمهم| يستخدم في 
الغالب الأعم في البحوث والتطبيق؟ فقد أجرت تشو (2001) ناط0 تحليلا 
للاستشهادات المرجعية للإنتاج الفكري المنشور في مبجال تكشيف الصور 
واسترجاعهاء وتبين لها أن النهج القائم على المحتوى كان هو الغالب في المجتال». 
وخصوصا في السنوات الأخيرة. ويفسر التعقد المرتبط باتباع النهج القائم على 
التوصيف. وتطور التقنيات الرئيسة التي تستخدم في النهج القائم على المحتوى؛ 
جزئياء نشأة ونمو الطريقة القائمة على المحتوى لتنظيم الوسائط المتعددة. إلا أن نتائج 
تشو لا تعني أن النهج القائم على المحتوى يمكن أن يكون الطريقة الوحيدة الثي يقع 
عليها الاختيار لتنظيم الوسائط المتعددة. وعلى العكسء فإن النهج القائم 
على التوصيفء إذا ما اتبع على نحو سليم ومطرد. قادر على تحقيق تنظيم جيدء 
قد يكون من الصعب بلوغه بالنهج القائم على المحتوى. ويبدو أن التكامل بين 
النهجين المختلفين» بالجمع بين مزايا كليهماء طريق مشالي يمكن اتباعه في تنظيم 
الوسائط المتعددة. 


التحديات فى تنظيم الوسائط المتعددة: 
بالإضافة إلى ما سبق أن ذكرنا من مشكلات مرتبطة بنهجي التنظيم» يبدو تجزىء 
0 عوج الصور المتحركة أو تقطيعهاء وتحليل الحديث ع8ظضأكهم «اعععم5. حجر 


عثرة في تنظيم الوسائط المتعددة؛ فتجزىء الصور المتحركة» خطوة لاغنى عنها لتحليل 
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الصور المتحركة إلى وحدات فرعية على سبيل المثال (كعمليات الكاميرا والسكتات 
الللحوظة 50115 5911636 مثلا) والأطر الرئيسة (أي الأطر التي تمثل كل لقطة) التي يمكن 
حينئذ أن تكون بمثابة الأساس لتحليل المحتوى وتنظيمه (1995 .1ه اع يوصقط2). 
ووو لاف و تادر اله جه عر مستت رالا دان لعو ليود 
المتحركة. إلا أن جوهر العملية يظل | هو: تقسيم الصور المتحركة إلى كيانات أصغر 
ها دلالتهاء بحيث يمكن تنظيمها على نحو مناسب وبدقة. 

ويدل تحليل الحديث على عملية تجزىء الأحاديث الكاملة إلى فقرات وجمل 
وعبارات وكلءات» حتى يمكن التحقق من محتواها الموضوعي وتنظيمها. ومن 
الصعب صياغة المعايير الخاصة بتحليل أي من الصور المتحركة أو تجزىء الحديث؛ 
نظرا لطبيعة الصور المتحركة والمعلومات الصوتية؛ فالصور المتحركة متواصلة في 
الزمان والمكان. إلا أن الفواصل بين لقطات الكاميرا المتعاقبة لا يمكن الاعتماد عليها 
دان لأعراض العهرىء. :وغل الندوانفسه أيضاءفإن متلومات انيت ل خضي 
. علامات ترقيم أو فراغات بين الكلمات» أو أي نوع آخر من العلامات» كما يمكن أن 
يكون عليه الحال في المعلومات التحريرية» وذلك للاسترشاد بها في التتجزىء. يضاف 
إلاادللك اماك انقو سونال اسن كسا وهاه لدي ادل بو الخو 1 
صعبة. ومن بين أمثلة قيود الحديث (1996 ,.21 أ© رقعص10 علءمقم5) الأحداث أو 
الو قائع غير المنطوقة 9215© طاءءءمكدمه (كالتنفس الجهري طاوءمط 1010 
وطقطقة اللسان كتاءثكء عتاقده؛)؛ ومظاهر انعدام الطلاقة وعأعمعس 150ل 
(كالكلمات التي لا تنطق كاملة: والوقفات, والتردد 844005)أة©) والأحداث 


“- 
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والمكونات الوظيفية (مثل حرف العطف 880 وعبارة بالإضافة إلى 2001010 صأ). 
ونظرا هذه المشكلات. فإن الأمر يتطلب المزيد من البحوث قبل أن تكون لدينا طرق 
آلية جيدة لتجزىء المحديث والصور المتحركة. ولا تزالٍ مشاركة الإنسان تبدو 
ضرورية في تنظيم الوسائط المتعددة» حتى باتباع النهج القائم على المحتوى. 

ويمكن القول بوجه عام؛ أن ما أجري من بحوث حول تنظيم الوسائط 
المتعددة أقل مما أجري جول تنظيم المعلومات النصية. ومن بين جميع أنواع الوسائط 
المتعددة المختلفة» تبدو المعلومات الصوتية أقل حظا في الدراسة من حيث التنظيم. 
وفي الوقت نفسه» يشهد العصر الرقمي كميات متزايدة من معلومات الوسائط 
المتعددة. ومن ثم» فإن سبل تنظيم معلومات الوسائط المتعددة تفرض تحديات 
ضخمة:؛ إذا ما أردنا أن نجعل معلومات الوسائط المتعددة من الممكن الوصول إليها 


عند الحاجة. 


مزيد من الاستطراد حول تنظيم المعلومات: 

تنظيم المعلومات أمر جوهري لا غنى عنه؛ في استرجاع المعلومات لسببين: 
أوهما أن المعلومات ينبغي أن تنظم لكي يكون من الممكن استرجاعهاء وثانيهما أن 
جودة التنظيم تؤثر في أداء الاسترجاع على نحو مباشر. يستند جهدنا في تنظيم 
المعلومات» بوجه عام, إلى سمات 088655 المعلومات» وحيثياتها أو محتواها 
و0105 في]| عدأ النهج القائم على المحتوى بالنسبة لتنظيم الوسائط المتعددة. 
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وتشمل السمات خواص كا مؤلف واللغة وتاريخ النشرء بين| تتعلق الحيثيات بالمحتوى 
الموضوعي للمعلومات. وللمقارنة فإن تنظيم المعلومات القائم على السهمات الشكلية 
أو الخارجية أو الملامح؛ مباشر واضح المعالم وأقل إثارة للتحديات» بيندا طرق تنظيم 
الحيثيات أو المحتوى أكثر صعوبة في تطبيقها. 

ويعاني أداء الاسترجاع. مالم يتم تنظيم المعلومات على نحو سليم مناسب. ولا ٠‏ 
يمكن المبالغة في تأكيد أهمية أن يكون لدينا تنظيم جيد للمعلومات. ومن ثم فإننا - 
ينبغي أن نرمي إلى التنظيم اليد للمعلومات» حتى يكون بإمكاننا العثور على ما 
نبحث عنه في عالم المعلومات الرقمية. 
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يه 


الفصل الرابع 
اللغة في تنظيم المعلومات واسترجامها 


اللغة ىما أشرنا بإيجاز في /١‏ ”/ 7 مكون أساس في كل من تنظيم المعلومات 
واسترجاع المعلومات (في صياغة الاستفسارات على سبيل المثال). وتتخذ اللغة في 
تنظيم المعلومات واسترجاعهاء شكل اللغة الطبيعية أو اللغة المقيدة. وحيث| يكون 
هناك خيار» فإن التساؤل يثار حول أي نوع من اللغة.يمكن للمرء أن يستخدم لتنظيم 
المعلومات واسترجاعها. 


اللغة الطبيعية: 

اللغة الطبيعية هي اللغة التي يتحدث بها ويكتب البشر. وفي اللغة الطبيعية لا 
يُبذل أي جهد في تنظيم المعلومات واسترجاعهاء للحد أو تحديد معالم المفردات 
لاقة1نا1/03 والنظم عنة ستاك والدلالة 5هناصةدمع5. والعلاقات المتبادلة في| بين 
المصطلحات. ويسمى ما يستخدمه البشر من أجل تنظيم المعلومات أو صياغة 
الاستفسارات دون اللجوء إلى لغة مقيدة باللغة الطبيعية. 

وعادة ما تستعمل اللغة الطبيعية بثلاث طرقء لتنظيم المعلومات واسترجاعها. 
والطريقة الأولى هى استعمال المصطلحات الواردة في العناوين (ككشاف الكلمات 
المفتاحية في السياق 1495/12 0 هآ ماوع ك1؛ على سبيل المثال)؛ والجمل 
الملوضوعية أو عناوين الفقرات 562168665 16م40» والمكونات المهمة الأخرى 
للوثيقة» لتنظيم المعلومات. والطريقة الثانية هي استعمال المصطلحات المستقاة أو 
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المشتقة من أي جزء بالوثيقة» لتنظيم المعلومات (كالتكشيف الاشتقاقي مثلا). أما 
الطريقة الثالثة فهي استعمال كلمات أو عبارات مقتطفة مباشرة من أسئلة المستفيدين» 
للتعبير عن الاستفسارء وهذا موضوع نناقشه في الفصل الخامس. 

وتتكون اللغة الطبيعية أساساء من نوعين من الكلمات؛ هما الكلمات المهمة 
والكلمات الوظيفية. والكلمات المهمة هي تلك المصطلحات التي تحمل معانٍ جوهرية 
أو مفاهيم موضوعية» بينما تشمل الكلمات الوظيفية الأدوات» وحروف الجر 
والروابط 01005 نازدمء» مغلث قط مأقطأ ,كلطا ,مغ ,كه ,101 ,لطة رعطا ,3 رقة 
كذعطا. وعندما تستخدم اللغة الطبيعية في تنظيم المعلومات واسترجاعها آلياء عادة ما 
يتم إعداد قائمة بالكلمات المستبعدة 1151 5608-0054 (أو قائمة |مستبعاد 1151 510 
للإيجاز), وتختزن في النظام لتحول دون أن تصبح تلك الكلمات مصطلحات تكشيف 
أو مصطلحات استفسار. وتضم قائمة الاستبعاد جميع الكلمات الوظيفية المحتملة» 
بالإضافة إلى تلك المصطلحات المغرقة في العمومية أو المألوفة» على النحو الذي يحول 
دون صلاحيتها كمداخل للتنظيم. وأحيانا ما تسمى مثل هذه المصطلحات بالكلمات 
المهنية 5806]؛ فكلمة ال هندسة وحدها على سبيل المثال» قد تكون لا معنى لما 
كمصطلح كشفي أو مصطلح استفساره في مرصد بيانات هندسي. وتدخل 
الملصطلحات ذات الطابع المؤقت 706791عطمع)» التي تعرف بالتعبيرات الطنانة 
45 في قائمة الاستبعاد أيضاء نظرا لأنها قد لا تصمد طويلا كمصطلحات 
تكشيف أو استفسار مرش حة. وتظهر معظم الكلمات الطنانة بوصفها تتصل 
بالتقنيات» على غرار الجوفر 61طممع.: وإنكار الخندمات”” ععتيايةو 2ه لةتمعل. ولا 
يمكن لأي من الكلمات التي ترد بقائمة الاستبعاد» أن تستعمل لأغراض التنظيم أو 


(”) أو ما يقابل ذلك في أي لغة بالطبع. (المترجم) 
(**) إحدى جرائم الإنترنت. راجع: إيان جيه. لويد. تشريعات تقنيات المعلومات. طه. ترجمة 
حشمت قاسم. القاهرة» المركز القومي للترجمة» قيد الطبع. (المترجم) 
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الاسترجاع. إلا أن كل نظام لاسترجاع المعلومات ينبغي أن تكون له قائمة الاستبعاد 
الخاصة به. التي يتم إعدادها خصيصا للنظام» من خلال النظر في المستفيد المستهدف 
وعوامل أخرى. 

وفي مقابل قائمة الاستبعاد. يمكن أيضا إعداد قائمة اعتبار ]5ذا مع لنظم 
استرجاع اللغة الطبيعنة (1992 ,لاء160[1). وجميع الكليمات المهمة» فياعذدا 
المصطلحات المهنية والتعبيرات الطنانة» مرشحة لعضوية قائمة الاعتبار. وكقائمة 
الاستبعاد» فإن قائمة الاعتبار قائمة للقراءة بواسطة الآلات» ومن الممكن النظر فيها 
أثناء التنظيم والاسترجاع. وتبدو قائمة الاعتبار في اللغة الطبيعية بوجه عام؛ أقل 
استعمالا في الغالب» من قائمة الاستبعاد» لسببين؛ أولها أن قائمة الاستبعاد أقصر 
وأيسر في تداولحاء ويمكن هذه التقنية أن تختبر بوجه عام. امعو ل الى لمعنه 
في تنظيم المعلومات واسترجاعهاء وثانيهها أن قوائم الاعتبار تستعمل في غالب 
الأحيان» في نظم اللغات المقيدة» في شكل مكانز» وقوائم رؤوس موضوعات» 
وخطط تصنيف. 

وقد تزايد في السنوات الأخيرة استعمال قوائم الكلمات» بوصفها لغة شبه 
منضبطة» في نظم الاسترجاع الآلية. ونظرا لآن قوائم الكلمات غالبا ما تشتمل على 
مترادفات وأضداد للمصطلحات التي ترد في الوثائق» قلما تنطوي على ضبط آخر 
للغة» فإنها تبدو شكلا آخر لقائمة الاعتبار. وتنشئ بعض نظم استرجاع الإنترنت» 
وتحرص على صيانة قوائم كلمات أو قوائم اعتبار لاستعالها الخاص. 


اللغة المقيدة: 
اللغة المقيدة 7031113579 0021501160 لغة اصطناعية.» حيث إن مفرداتها 


ونظمها 0]3/إ5» ودلالتها وسياقاتبا محدودة ومحددة المعالم (1995 ,لءؤ11اء11). ومن 
الممكن للكلمة نفسها في لغات مقيدة مختلفة» أن تكون لما معان مختلفة تبعا لتوجه 
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اللغة. وينبغي أن يتم بناء اللغة المقيدة وصيانتهاء واضعين في الحسبان مجالا موضوعيا 
معينا أو عدة مجالات؛ ويتم انتقاء المصطلحات التي تدخل في اللغة المقيدة» باتباع مبدأ 
مسوغ الونتاج الفكري أو المسوغ الأدبي أمقصة6 بتقوعائكء أو مسوغ المستفيد 11565 
1ك ويعني المسوغ الأدبي أن يتم اختيار المصطلحات التي تتضمنها اللغة 
المقيدة» من الإنتاج الفكري القائم. وعلى النحو نفسه؛ فإن مسوغ المستفيد يعني أن 
تكون المصطلحات التي يتم اختيارها لتتضمنها اللغة المقيدة» قد استعملت بالضرورة 
في الماضي. والمكانز» وقوائم رؤوس الموضوعات» وخطط التصنيف هي الأنواع 
الثلاثة الرئيسة للغات المقيدة. ّ 


المكانز: 


المكنز ونعناة165» لغة مقيدة للمصطلحات باللغة الطبيعية» يتم إعداده للربط 
اللاحق ,2000منل001ع-051م ,23602 1مدع012 0ةلطلة51 ومتتدمصمكصآ لهده6د1) 
(1993. كذلك تعرف راولي (1992) 10:16 المكنز على النحو التالي: 


تجميع للكليات والعيارات» يبرز المترادفات وعلاقات 
التقسيم ال هرمي. وغيرها من العلاقات والارتباطات» ومهمته 
توفير لغة معيارية لنظم اختزان المعلومات واسترجاعها. .7) 
(252 


وينطوي الربط اللاحق على جهد بشري تحكمي 25081810120106 وهو أحدث 
بكثيز من لغات الربط المسبق 51756-000:50128]1052» كخطط التصنيف. و تكفل لغات 
الربط اللاحق, كالمكانز مثلاء للمستفيدين القدرة على الربط بين المصطلحات أثناء 
التنظيم والاسترجاع. ووجه القصور الرئيس في الربط اللاحق هو الربط المزيف 12156 
20 وكمثال على ذلك فإن كلمتي ”لاسب و مكتسبت يمكق أن 
يرتبطا معا بشكلين؛ ”مكتب الحاسب'“ و“حاسب المكتب“ “» تبعا للمقصد الأصلي؛ 
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فإذا كان المقصود هو ”حاسب المكتب“ فإن نتائج الربط مثل “مكتب الحاسب” 
يمكن النظر إليها بوصفها ربطا مزيفا. 

وتستخدم الرموز 202085 المعيارية في المكانز» لتحديد العلاقات التفريعية» 
والترابطية» والقائمة على الجناس أو المشترك اللفظي» وغيرها ما بين المصطلحات 
الواردة من علاقات. ويدل المختصران 175158 و01] (يستعمل ل) على أي مصطلحات 
المكنز تعد واصفات مفضلة.» ويحدد المختصر 581 (بيان المجال 2016 6م0ن5) معالم 
معاني الواصفات. ويدل 711 (مصطلح أضيق اا 0327018761) و81 (مصطلح 
أعرض ممع م6:0306) على العلاقات الهرمية في بين الواصفات. ويتم التعبير عن 
علاقات التداعي أو الترابط 2550180176 بين الواصفات بالرمز 215 (مصطلحات 
متصلة أو مرتبطة 6215 761360). وعادة ما ترتب المكانز هجائيا وهرميا. أما شكل 
العرض أو الترتيب الدوار أو التبادلي» أو النسقي أو التصنيفي» والتصويري 
عنطمقمع» فأحيانا ما نجده في مكانز معينة أيضا 2 أكمطء!1© ,«مكتطع]ئه) 
(1997 ,مع8210. 

والمكانز هي أكثر اللغات المقيدة المستعملة شيوعاء في تنظيم واسترجاع 
المعلومات غير الكتب؛ نظرا لدقتها ومرونتها وقدرتها على التعامل مع المفاهيم المركبة. 
وواصفات مكنز مركز معلومات المصادر التربوية 165015665 20106200081 
(58110) اعاصعن) م2005 ممه 01ل مثال على ذلك. 


قوائم رؤوس الموضوعات: 

قائمة رؤّوس الموضوعات» لغة مقيدة للمصطلحات في اللغة الطبيعية؛ يتم 
إعدادها لكل من الربط المسبق والربط اللاحق. ويجمع الربط المسبق الذي كان سائدا 
قبل أربعيئيات القرن العشرين بين المصطلحات قبل استع لها لأغراض التنظيم 
والاسترجاع. فإذا كان المرء ينوي» على سبيل المثال» تنظيم أو استرجاع وثائق حول 
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"نظم استرجاع الإنترئت كارءاوبرى [مودءة«اعم 1ءرء1سة ''» فإن العبارة المكونة من 
ثلاث كلمات» يمكن أن تظهر على وجه التحديد في صيغة مترابطة سلفاً» ومن ثم فإن 
اللغات المقيدة المترابطة مسبقا أو سلفاًء ليست تحكمية 1]196نام208208. ولما كانت 
قوائم رؤوس الموضوعات تكفل كلا من الربط المسبق والربط اللاحقء فإنها تبدو 
أكثر مرونة من خطط التصنيف, ولكنها أقل مرونة من-المكانز. 

وتسمى المصطلحات. في قوائم رؤوس المؤضوعات برؤوس الموضوعات» 
وترتب هجائيا. وتشمل الرموز بالنسبة لرؤوس الموضوعاتء انظر 56» للإحالة من 
المصطلحات غير المفضلة إلى المفضلة» في حين يمثل 6< الذي يعني “انظر من" 566 
2 التعبير المقابل لإحالة ”انظ ر“» كما في '“معاق 0300102060“ انظر 0 
بدنيا 4ع211658طه '(الهءأونؤطم”' » و" “عاجز بدنيا'' انظر '”معاق“. وهناك مجموعة 
أخرى من الرموز الخاصة بقوائم رؤوس الموضوعاتء تشمل ”انظر أيضا 566 
0 ' » و3636 الذي يفيد '”انظر أيضا من 1020 2150 ع56''» وتدل إحالة '“انظر أيضا 
0 م56 على كل من العلاقات التفريعية والترابطية بين رؤوس الموضوعات 
التي يقع عليها الاختيار. إلا أن ذلك الأسلوب ينال من مدى تخصيص قوائم رؤوس 
الموضوعات ودقتها. وعلى غرار الرمز 36 يدل كا على التعبير التقابلٍ لعبارة 
انظر أيضا. 

وتستعمل قوائم رؤوس الموضوعاتء بوجه عام» لكل من تنظيم المعلومات 
واسترجاعهاء على الرغم من أنه قد يبدو أنها تستخدم على نحو أقل من المكانز, 
لأغراض تنظيم واسترجاع المعلومات غير الكتب. وقائمة سيرز لرؤوس الموضوعات 
01 أعء[1ا3 07 أكقط 56075 من أمثلة هذه القوائم. والمثال الآخر الشهير هو 
رؤوس موضوعات مكتبة الكونجرس أء[طلاى 007187655 07 هرطضا 
75 التي تبدو رموزها في الطبعة الحادية عشرة أقرب شبها بالمكانز. 
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خطط التصنيف: 

خطة التصنيف. لغة مقيدة من مصطلحات في شكل هجائي رقمي» توضع في 
المقام الأول للربط المسبق. وتسمى الوحدات في خطط التصنيف بالفئات 0135565» 
التي تميز بعد ذلك رقمياء أو هجائياء أو هجائيا رقميا. ويوصغها أول أنواع اللغات 
المقيدة التي تم وضعهاء شهدت خطط التصنيف. وعايشت تغيرات عدةء طوال 
القرون الماضية. ومن ناحية أخرى يتم تحديث هذه الخطط ومراجعتهاء مرارأ وتكرارا 
بمرور الوقت. 

وعلى عكس المكانز» فإن قوائم رؤوس الموضوعات وخطط التصنيف. يتم 
بناؤها وفقا لإطار اصطناعي للمعرفة. فقد جنح تصنيف ديوي العشري» على سبيل 
المثال» لتقديم عالم المعرفة على أساس عشرة أقسام. ويتم تشكيل عشر فئات على وجه 
التحديد» عند كل مستوى للتفريع في إطار الخطة, الأمر الذي يدل على جمود النظام. 
ويتم إبراز العلاقة التفريعية بين الفئات باستعمال مسافات أو أبعاد مختلفة لرموز 
التصنيف؛ أي إنه كلما طال رمز التصنيفء ازداد عمق مكان الفئة في البنيان المرمي. 
ويتم إبراز العلاقات الترابطية بين المصطلحات عن طريق أسلوب ”انظر” و"انظر 
أيضا“ الذي لا يستخدم إلا عرضا. 

وغالبا ما يتم اختيار خطط التصنيف تقليدياء لتنظيم واسترجاع معلومات 
الكتب. وتصنيف ديوي العشري» وتصنيف مكتبة الكونجرس مثالان 
لخطط التصنيف. 


المكانز في مقابل قوائم رؤوس الموضوعات وخطط التصنيف: 

يلخص الجدول رقم ١/54‏ خصائص كل من هذه الأنواع الثلاثة للغات 
المقيدة. وبالإضافة إلى ما تمت مناقشته: فإن طريقة التحليل خاصية أخرى ترتبط 
باللغات المقيدة. ويعني الحصر 681106581092 بوصفه طريقة للتحليل» ببساطة» توفير 
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قائمة بالمصطلحات دون القدرة على الربط فيا بينهاء للتعبير عن شيء ما أكثر تعقدا. 
أما التركيب 502056515 فيكفل» على العكسء الربط بين بعض المصطلحات؛ لتكوين 
مصطلحات أكثر تعقداء في مرحلة التنظيم أو المدخلات»ء أو في مرحلة إجراء عمليات 
البحث والاسترجاع (1986 ,20851]67هآ). وترتبط طريقة التحليل ارتباطا وثيقا 
بطريقة الربط. أي أن لغة الربط المسبق حصرية؛ بينما لغة الربط اللاحق تحليلية 
تركيبية» كذلك تحدد طرق التحليل والربط مدى تخصيص اللغة المقيدة ومرونتها. 
وتبدو اللغة التحليلية التركيبية ولغة الربط اللاحق أكثر تحديدا أو تخصيصا وقابلية 
للاستيعاب من اللغة الحصرية أو لغة الربط المسبق. 

ووفقا للجدول رقم ١/5‏ تبدو المكانز أكثر تخصيصا ومرونة من خطط 
التصنيف. بين| تقع قوائم رؤوس الموضوعات في مرتبة وسط بينهما على هذا الطيف. 
الأمر الذي يفسر السبب في أن تصبح المكانز أوسع اللغات المقيدة انتشارا 
في الاستخدام. 


اللغة الطبيعية في مقابل اللغة المقيدة: 

ناقش القسان السابقان ملامح وخصائص كل من اللغة الطبيعية واللغة 
المقيدة. وآن الأوان للنظر في أوجه الاختلاف فيا بينهماء والقاسم المشترك بينها 
كلغات لتنظيم المعلومات واسترجاعها. 
الحقب المختلفة للغات تنظيم المعلومات واسترجاعها: 

تعد اللغات المقيدة» في تاريخ تنظيم المعلومات واسترجاعهاء وافدا جديدا 
بالمقارنة باللغة الطبيعية. ومن الممكن التحقق من معالم أربع حقب في تطور لغات 
تنظيم المعلومات واسترجاعها حتى الآن. 
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وتدل الحقبة الأولى على زمن ما قبل ظهور أي لغة مقيدة. فقد كانت اللغة 
الطبيعية هي اللغة الوحيدة المستخدمة؛ بينما كان تنظيم المعلومات واسترجاعها 
يتشكل كمجال موضوعي. وبدأ الناس يدركون أوجه القصور (كالمشترك اللفظي 
والمترادفات مثلا) في اللغة الطبيعية» عندما كانت تستعمل لتنظيم المعلومات 
واسترجاعها. 


الجدول رقم 4/ ١‏ مقارنة اللغات المقيدة 


د 5 
الك آْ 1 


رموز الإحالاات ,51 ,01 ولآ انظر انظر 
81,1017 أيضا 


اتحليل والتركيب جاه 
الفعصيض ا | 00 ايرحاقل | 


الكتب 
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وتدل الحقبة الثانية على دخول اللغة المقيدة إلى تنظيم المعلومات و استرجاعها. ففي 
البداية كانت نظم الربط المسبق كخطط التصنيف» تستخدم بكثافة. ثم ظهرت أنواع أخرى 
من اللغات المقيدة» وهي قوائم رؤوس الموضوعات والمكانز في)| بعد. وقد تعايش كلا 
النوعين من لغات تنظيم المعلومات واسترجاعهاء في هذه الحقبة» مع الميل نحو اللغة المقيدة. 
كذلك بدأ الجدل حول اللغة الطبيعية في مقابل اللغة المقيدة حيتكذ» ولا يزال متواصلا. 

وتتميز الحقبة الثالثة بنهضة اللغة الطبيعية من جديد» نتيجة لأساليب استرجاع 
الكلمات المفتاحية» وتطؤر نظم النصوص الكاملة. ولا تزال اللغة المقيدة تستخدم* 
لتنظيم المعلومات واسترجاعهاء ولكن في نظم الاسترجاع الوراقية (الببليوجرافية) في 
الغالب الأعم. فهل يمكن للغة المقيدة أن تظل لغة صالخحة لتنظيم المعلومات 
واسترجاعها؟ فقد ثار الكثير من الجدل في تلك الحقبة في| يتعلق باللغة الطبيعية في 
مقابل اللغة المقيدة. 

ثم بدأت الحقبة الرابعة» عندما بدأ استعمال واجهات التعامل باللغة الطبيعية في 
تنظيم المعلومات واسترجاعهاء واستخدام تقنية لغة مقيدة خلف ستار. ونظرا لأن 
نبج اللغة المقيدة لا يمكن رؤيته من جانب المستفيد النهائي» فقد أسمتها ميلستيد 
(1995) 2115:6340 اللغة المقيدة الخفية في بيئة استرجاع اللغة الطبيعية. ومن بين 
الأمثلة على ذلك إخفاء اللغة المقيدة وراء غلاف 58611 اللغة الطبيعية. وقد أسهمت 
مظاهز التقدم في معالجة اللغة الطبيعية» على نحو ملحوظ أيضا في هذا التطور. وقد 
بدأت بعض نظم استرجاع المعلومات» كنظام وست المسمى ون 18/181 ]171/65 
(وستلو طبيعي 11300531 15 977/65]131) تقدم خدمات استر جاع باللغة الطبيعية. 

وعلى الرغم من أن الحدود الفاصلة بين مختلف الحقبء لا تبدو على قدر كبير 
من الوضوح والتحديد, فإن لغة تنظيم المعلومات واسترجاعهاء قد اجتازت بجلاء 
الحقبتين الأوليين» وتمر الآن بالحقبتين الثالثة والرابعة. 
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لماذا اللغة الطبيعية أم لماذا اللغة المقيدة؟ 

ينبغي أن تكون هناك أسباب وراء تعايش اللغة الطبيعية مع اللغة المقيدة» في 
تنظيم المعلومات واسترجاعها. ولا تخرج الأسباب عن وجهات النظر المؤيدة 
ووجهات النظر المعارضة لكلا النوعين من لغات تنظيم المعلومات واسترجاعها. 
قضية الترادف: 

قضية المترادفات إنحدى أكثر الحجج التي تساق ضد استعرمال اللغة الطبيعية» في 
تنظيم المعلومات واسترجاعها؛ فالمترادفات في اللغة الطبيعية مصطلحات مختلفة 
تؤدي المعنى نفسه. فالحاسبات المصغرة 101615م12010506012: والناسبات الشخصية 
5 06150123131) وبي مي 505) و سطح المكتب م06510. والمفكرات 
0 وسطح الركبة م0]م13» وما هو على شاكلتها مترادفات”. إلا أن أءئ 
مصطلح في هذه القائمة الجزئية يمكن أن يقع عليه الاختيار» ويستعمل لأغراض 
تنظيم المعلومات واسترجاعها؟ وهذه إحدى قضايا الجدل حول لغات تنظيم 
المعلومات واسترجاعها. وعندما تكون اللغة المقيدة هي لغة تنظيم المعلومات 
واسترجاعهاء التي وقع عليها الاختيار» فإن المترادفات لا تصبح مصدرا للمخاوف». 
لأن مصطلحا واحداء وواحد فقط هو ما يقع عليه الاختيار في اللغة المقيدة بوصفه 
المصطلح المفضل. أما بقية المترادفات فتعامل بوصفها مصطلحات غير مفضلة» ويحال 
منها إلى المصطلح المفضل. 


(*) مثال غير موفق للأسف. لأن البي مي اخختصار مباشر للحاسب الشخصيء والمفكرات وسطح 
الركبة وغيرهاء من الحاسيات المحمولة» وإن كانت تستخدم لأغراض شخصية. تختلف عن 
الشخصي وسطح المكتب» ومن ثم فإنه يمكن النظر إلى هذه المصطلحات بوصفها أشباه 
مترادفات. (المترجم) 


17 


قضية المشترك اللفظي: 

تبدو الكليات المتفقة شكلا المختلفة معنى 50172035 الناتجة عن الظاهرة 
المعروفة بتعدد المعانى 0125620م» حجة أخرى: غالبا ما تساق في الجدل حول اللغة 
الطبيعية في مقابل اللغة المقيدة. ويعنى المشترك اللفظي أو الجناس»ء وجود مصطلحات 
هجاؤها واحد ولكنها تحمل معانٍ مختلفة في السياقات المختلفة. ومصطلحات مثل 0160010 
وأءةزطناة» وعنقل» وعصتامد» وعلضةطء ولزانال مجرد أمثلة قليلة للمشترك اللفظى”. وفي 
اللغة الظليعية ف نظيو الغلوقاتواسةز جاغهاء يمككن للمتشترك اللقطي؛نظرا لكينات 
السياق» أن يسفر عن مشكلات كالغموض مثلا. وقد تبين للاتكستر وورنر تعاكةع1نهمآ 
(1993) معمعة/ا 0م أن مشكلة الغموض في الاسترجاع, الناتجة عن المشترك اللفظي 
غالباء ما تكون نظرية أكثر منها فعلية» نظرا لأن الكلمات التى يمكن أن تكون غامضة في حد 
ذاتهاء لاتصبح كذلك عندما تستعمل مرتبطة بكلمات أخرى””. حقا يمكن للمشترك 
اللفظي ألا يصبح غامضا في معناه. إذا ما استعمل مرتبطا بكلمات أخرى. إلا أن الارتباط في 
الاستعمال قد يحدث أو لايحدث في اللغة الطبيعية لتنظيم المعلومات واسترجاعها. وفي 
مقابل ذلك» فإن السياق اللازم لتفسير المشترك اللفظي. دائم| ما يتوافر عن طريق وسائل 
مختلفة في اللغة المقيدة. ومن بين الوسائل المألوفة استعمال الأقواس لتخديد سياق المشترك 
اللفظيء ك! في لإ؛ناك (المستولية) ولاناك (الضرائب)” "©. 


قضية النظم***": 
للغة تظمهاء ولكن كيف يمكن التعبير عن النَظْم خنةاتلا عندما يقع الاختيار 
على اللغة الطبيعية لتنظيم المعلومات واسترجاعها؟ هب أن وثيقة ماتم تمثيلها 


3 ') يناظر ذلك في العربية ' 'عين “أو ا كل اكات (المترجم). 

(**) أي عندما توضع في سياق معين. (المترح 

(**”) يقصد بذلك تحديد المجال الموضوعي 1 الكلمة. (المترجم) 

5 ُ( النحو 8531715381 مستويان؟ الصرف تزع امطمعمهم أي بناء الكلمة» والنظم 570 
أي بناء العبارة أو الجملة. ؤهناك من يستعمل ''النحو“ مقابلا لكلمة ” '#اقغصوة'"“. إلا أننا نرى 
في ذلك ما يجاني مقتضيات الدقة. (المترجم) 
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بالتسطالحات النقة "اليناف التحدة الأدركية رو" و"اتسارات 
5ءانطمروزيره '“ و *”اليابان «ورعل' '» فى اللغة الطبيعية؛ فهذه الوثيقة يمكن أن تدور 
على سبيل المثال» حول تصدير اليابان لمانا ات إلى الولايات المتحدة الأمريكية: أو 
العكس. تصدير الولايات المتحدة للسيارات إلى اليابان. ومن غير الواضح أي دولة 
هي المصدّرء عندما ترد هذه المصطلحات الثلاثة فقط دون أي معلومات عن التَظو”. 
ومن الممكن حل هذه المشكلة بسهولة في اللغة المقيدة» بوسائل كالأدوار 50165) وهي 
رموز أو أرقام تدل على العلاقة النظمية بين المصطلحات. ومن الممكن في هذا المشال 
تعريف الرقم ١‏ بوصفه دور المصدّرء ثم نضعه بعد المصطلح ””اليابان #همهل“: أي - 
)1( نم. وعلى النحو نفسه يمكن تسمية الرقم ” بوصفه دور المستورد» ثم نعينه 
للمصطلح 754]؛ أي (2) 1154. ومن شأن مثل هذه الطريقة المتبعة في اللغة المقيدة» 
أن تكفل لنا التغلب على قضية التظمء بين| لا تكفل اللغة الطبيعية ذلك. 
قضية الدقة: 

دائم) ما يكون من المرغوب فيه, أن تكون هناك لغة لتنظيم المعلومات 
واسترجاعهاء يمكن أن تعبر بدقة عن المعلومات واستفسارات البحث. ويبدو هذا 
الهدف قابلا للتحقيق إذا ما وقع الاختيار على اللغة الطبيعية؛ بوصفها لغة لتنظيم 
المعلومات واسترجاعها. والمبرر المنطقي لهذه العبارة ثنائي الأبعاد؛ أولاء لا حاجة إلى 
معالجة إضافية (كالشرح مثلا) إذا ما استعملت اللغة الطبيعية للتنظيم والاسترجاع» 
ثانيا لا ضرورة للتفسير عند استعمال اللغة الطبيعية في التنظيم والاسترجاع, لأن ما 
يستعمله المؤلف أو المستفيد إنم| هي اللغة التي تستعمل في تنظيم المعلومات 


(5) ربا يدرك الناطقون بالعربية مدى عبقرية نظام النحو العربي المرتبط بالدلالة؛ إذ لا يمكن معرفة 
معنى الكلمة على وجه التحديد إلا بإعراءها أي بيان موقعها في الجملة. والقراءة السليمة مرتبطة 
بالإعراب. ورب| يدل ذلك على مدى ما فقدت اللغة العربية نتيجة لتجاهل الحركات في معظم 
النصوص المطبوعة. (المترجم) 
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واسترجاعها. وبالمقارنة» فإن اللغة المقيدة اصطناعية» ولا تدل على ثراء اللغة 
الطبيعية» التي تستعمل في إنشاء الوثائق والتعبير عن استفسارات البحث. كذلك 
تفتقر اللغة المقيدة أيضا إلى التحديد أو الدقة» نتيجة لما تتعرض له في عملية المعالجة. 
ويبدو تفسير اللغة المقيدة أمرا لا غنى عنه؛ نظرا لأن مضمون كل مصطلح ودلالته إن 
تتحدد معالمهها بوضع متلق مستهدف بعينه في الحسبان. ويمكن لمثل هذا التفسير أن 
يفضي حتم) إلى عدم الدقة في لغة التنظيم والاسترجاع التي تعتمد على اللغة المقيدة”. 
قضية التحديث: 

لا تحتاج اللغة الطبيعية إلى أي تحديث 081188جناء بينم| تحتاج اللغة المقيدة إلى 
ذلك؛ فمن الممكن للمصطلحات الجديدة أن تستعمل لأغراض تنظيم المعلومات 
واسترجاعها بمجرد أن ترد في اللغة الطبيعية» بين لا يمكن حدوث أي تغيير في اللغة 
المقيدة» إلا حين تعرضها لعملية التحديث الجامدة المطولة. ومن ثم فإن المصطلحات في 
اللغة المقيدة ليست حديثة على الدوام. ولا يمكن بحال الرد على الاستفسارات التي 
تتضمن مصطلحات جديدة» إذا ما وقع الاختيار على اللغة المقيدة للتنظيم 
والاسترجاع' ". 


ا هناك من يرى أن تدخل اختصاصيي المعلومات وجهدهم في وضع اللغات المقيدة» با 
ينطوي عليه من تحكمء من شأنه أن يؤدي إلى شيء من الشوشرة في نظام التواصل بين المصدر أو 
المنشئ من جهة والقارئ أو المتلقي من جهة أخرىء نتيجة لإضافة بعض الملامح أو الخواص 
الاصطناعية» التي قلما تكون محل اتفاق بين الطرفين. (المترجم) 
(*) يعني ذلك أنه تظل هناك دائم|ا فجوة معجمية بين | للغة الطبيعية التي تستعمل للتعبير عن 
. الأقكار والمفاهيم من منشئهاء واللغة المقيدة. فقد تستعمل مصطلحات جديدة في اللغة الطبيعية لا 
تستوعبها اللغة المقيدة إلا بعد حين طال أو قصر. (المترجم) 
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ةّ غية التكلفة: 

يستنفد إنشاء وصيانة اللغة المقيدة للتنظيم والاسترجاع؛ واكتسناب القدرة على 
استع لها وقتاً لا يستهان به. ومن شأن هذا الوقت اللازم هذه الأنشطة؛ أن يترجم في 
النهاية إلى تكلفة في تنظيم المعلومات واسترجاعها. وفي مقابل ذلكء فإن اللغة 


واسترجاعها باللغة الطبيعية أي تدريب أو صيانة. 


قضية التوافق: 

يحدث في بعض الأحيان أن يصبح نظام اختزان المعلومات واسترجاعهاء 
بحاجة لتغيير لغته في أثناء تطويره؛ أو عندما يرغب أحد المستفيدين في إجراء عملية 
البحث نفسها في عدة مراصد بيانات. وهكذا تبرز قضية التوافق أو التناغم 
اذ همده بالنسبة للغة المقيدة؛ نظرا لأن لكل لغة مقيدة. مقوماتها وخصائصها 
المتميزة. ويبدو من المستحيلء على سبيل المثال» استخدام تصنيف ديوي العشري» 
لإنجاز مهام تنظيم واسترجاع. في فهرس متاح للجمهور على الخط المباشر (08460) 
اخقار تصنيف مكتبة الكونجرس بوصفه لغته المقيدة. وإذا كانت النظم قائمة على 
اللغة الطبيعية» فإنه يمكن حينئذ للتحول أو الانتقال من نظام إلى آخرء أن يكون 
سلسا على الدوام» لأن اللغةٌ الطبيعية ينبغي أن تكون دائ] متوافقة مع نفسها. وتسمى 
هذه القضية بقضية القابلية للتشغيل التبادلي» باستعارة المصطلحات المستعملة 
في النظم الإلكترونية (2004 ,038 86 2688). وعلى النحو نفسه أصبح ”نظم 
معالجة المعرفة 5طاعا5لا5 32122]108ع07 1201/16088'' مصطلحا جديدا بالنسبة 
للغات المقيدة. 


1531 


وقصارى القولء فإن مظاهر قوة اللغة المقيدة في الترادف. والمشترك اللفظيء 
الضعف في اللغة المقيدة وهى الدقق والتحديث» والتكلفة» والتوافق» نقاط القوة 
بالنسبة للغة الطبيعية. وكا كررت راولي (1994) 120:16 مراراً في أحد أعماها: 
هناك اعتراف عام بأن كلا من اللغة المقيدة واللغة الطبيعية 
ينبغي استع الما مرتبطتين معاء ى| أن هناك شيء من الاتفاق حول 
المزايا النسبية لكل من النظامين. (116 .م) 
وبعبارة أخرىء فإن كلا من اللغة الطبيعية واللغة المقيدة» قد وجدت مكاهها في 
تنظيم المعلومات واسترجاعهاء ولكن هل سيستمر الأمر كذلك؟ 


اللغة لأغراض تنظيم المعلومات واسترجاعها في العصر الرقمي: 

تستخدم كل من اللغة المقيدة واللغة الطبيعية بالتوازيء لتنظيم المعلومات 
واسترجاعها في البيئة الورقية. وفي عالم الخط المباشر» لا تزال هناك حاجة للتدخل 
البشري العميق في تنظيم المعلومات واسترجاعها؛ إذ تحتل اللغة المقيدة الموقع المسيطر 
كلغة للتنظيم والاسترجاع: وفي العصر الرقمي أصبحت اللغة الطبيعية هي القاعدة 
بالنسبة لتنظيم المعلومات واسترجاعهاء بين| لا تستعمل اللغة المقيدة إلا عرضا أو على 
نطاق ضيق جداء نظرا للخواص الفريدة للمعلومات الرقمية. 

وتتوافر على الإنترنت نسبة مئوية ضخمة من المعلومات الرقمية» بينما تبدو 
تقنيات ضبط الحودة غائبة» ومتوسط العمر الافتراضى للمعلومات قصير في حين 
ينمو كم المعلومات اك ومن ثم فإن أي استخدام للغة المقيدة: باهظة التكلفة في 


(*) يتضاعف كل فترة زمنية معينة» أي ينمو بمتوالية هندسية. (المترجم) 
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البيئة الرقمية لتنظيم المعلومات واسترجاعهاء يتطلب تبريرا وترشيدا. ولا تستخدم 
نظم استرجاع الإنترنت الشهيرة» التي تتكفل بمعظم مهام تنظيم المعلومات 
واسترجاعها على الإنترنت. اللغة المقيدة على الإطلاق. ويبدو استعمال قوائم الكليات 
من جانب قليل من نظبم استرجاع الإنترنت» أقرب شيء للغة المقيدة في تنظيم 
المعلومات الرقمية واسترجاعها. 

غير أن اللغة الطبيعية لا يمكن أن تكون اللغة الوجيدة لتنظيم المعلومات 
واسترجاعها في البيئة الرقمية» نظرا لأن الافتقار إلى ضبط اللغة أو التحكم فيها يمكن 
أن يكون واحدا من الأسباب الجوهرية لإنخفاض جودة نتائج أو مخحرجات نظم 
0 حول هو عببية عل 
كاهل اختصاصيي المعلومات. إلى كاهل المستفيدين النهائيين» عندما يقع الاختيار على 
اللغة الطبيعية لتنظيم المعلومات واسترجاعها. إلا أنه عند استعمال اللغة المقيدة 
رسمياء فإن مهمة ضبط اللغة ينبغي أن تقع على عاتق اختصاصيي المعلومات. ومالم 
يحدث ذلك فإن المستفيد النهائي ينبغي أن ينهض بدور ضبط اللغة على نحو غير 
رسميء وذلك على سبيل المثال. بالتفكر في المصطلحات المترادفة التي تدعو الحاجة 
إليهاء في صياغة استفسارات البحث. ولا ينبغي أن يصبح التفاعل المتزايد بين المستفيد 
النهائي ونظام استرجاع المعلومات. في البيئة الرقمية» ذريعة لإلقاء عبء ضبط اللغة 
عل كاهن لطي نهاتي 1ك الله [ا يمي بحن سامير الماومات عكر 
النهوض بمهمة متواضعة في هذا الصدد. 

زذف» كفل كن انتيكتوة تسيل اللفة القينة علخ فنطين العلونات 
واسترجاعها في العصر الزقمي؟ ولا تبدو الإجابة عن هذا السؤال مؤكدة على 
الإطلاق. وبنظرة فيما مضى يبدو أن هناك أربع طرق مختلفة يمكن بها استعمال اللغة 
المقيدة في تنظيم المعلومات واسترجاعها (1993 ,تعصمة/7 به معامدعهما): 
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.١‏ استعبال اللغة المقيدة لكل من التنظيم والاسترجاع. 
+ اشضوال اللقة القريغية لكل سن العلي والاسترجاع ولككن بشباعدة 
أدوات اللغة المقيدة» كالأدوار والربط المسبق. 
". استعمال اللغة المقيدة للتنظيم فقطء أما الضبط من أجل الاسترجاع فيتم 
بوسائل أخرى كاللغة المقيدة الكامنة أو غير المرئية في النظام. 
4. استعمال اللغة المقيدة للاسترجاع فقط. ويتم تطبيق هذا النهج باستعمال 
مكنز البخث فقطء الذي يعرف أيضا بلغة الربط اللاحق. 
وعند النظر في خصائص تنظيم المعلومات واسترجاعها في البيئة الرقمية» يبدو 
النهج الثاني أكثر جدوى من غيره. فكل من النهج الثالث والرايع يختزنان لغة مقيدة 
على الخط المباشر من أجل المراجعة أو البحث. الأمر الذي يبدو أيضا خيارا مناسبا 
لاستخدام اللغة المقيدة. ومن ناحية أخرى» شهد مجال تنظيم المعلومات واسترجاعها 
في السنوات الأخيرة» بروز أطر لغوية كالتقسيرات الحرمية 5عنم000::ةاء 
و التصنيفات المتعارف عليها 65نم501150201» والتصنيفات التخصصية 02]0108165. 
وعلى الرغم من أن لكل إطار خصائصه الفريدة» فإنها جميعا قد تطورت لأغراض 
التنظيم والاسترجاع في العصر الرقمي. 
التقسيمات الهرمية: 
وش مصطلح التقسيم الهرمي 0200 الذي ناقشناه بإيجاز في "/ 2.7 
كتركيب مزجي من الكلمتين اليونانيتين ولكنة) (بمعنى نظام أو ترتيب) و201205 
(بمعنى قانون أو علم). وكان التقسيم ال هرمي يدل في البداية على تصنيف الكائنات 
الحية (كالحيوانات والنباتات على سبيل المثال). إلا أن هذا المصطلح يكتسب الآن 
معنى أكثر اتساعا وأكثر عمومية تما كان من قبل؛ إذ يعرف الآن بأنه تصنيف جميع 
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الأشياءء ا يمتد معناه ليتجاوز حدود التغطية السابقة للكائنات الحية. وكما ذهب 
جلكرست (2003) 6110156 فإن أقدم إشارة إلى الاستعمال الحديث للمصطلح» 
ظهرت عام ١19917‏ في مقالة حول ياهو! !00طةلآ» أحد نظم استرجاع الإنترنت؛ الذي 
يستمد جذوره من خدماته الإرشادية القائمة على التقسيم الحرمي الذي اشتهر به. 

وتمتد جذور التقسيمات اطرمية في الواقع إلى كل من خطط التصنيف والمكانز. 
وكا هو الحال في خطط التصنيف. فإنها تعبر عن العلاقات الحرمية فيا بين الفئات» أي 
الوحدات الأساس للتقسيم الهرمي» بمستويات مختلفة للعرضء ولا تستعمل 
الأشكال الحجائية الرقمية للرموز» وسيلة التصنيف المألوفة. في التقسيات الحرمية. 
ويتم التعبير عن العلاقات الترابطية فيم] بين الفئنات هجائيا عند كل مستوى, على نحو 
يحاكي بنيان إحدى طرق العرض المألوفة في المكانز. إلا أنه على عكس خطط 
التصنيف والمكانز لا تكفل التقسيمات الحرمية أي وسيلة للإحالة» الأمر الذي ينتقص 
من الوظيفة التي يفترض للغة المقيدة أن تتكفل بها. 

وتستخدم التقسيمات الهرمية التي تتحدد معالمها بخواصهاء بوجه عام لتقسيم 
المعلومات إلى فئات» ودعم التصفح, أحد طريقتي الاسترجاع. وتبدو هذه التقسيمات 
جاذبة يوجه خاص بالنسبة لمرافئ 014815م معلومات المشروعات» من أجل 
احتياجاتها لتنظيم المعلومات واسترجاعها (2003 ,]5ذقط6110)» بالإضافة إلى تنفيذها 
على الإنترنت. ومن بين الأسباب الكامئة وراء هذا الضرب من الاهتام» قدرة 
التقسيمات ال هرمية على استيعاب اللغات المختلفة» التي يمكن أن تتوافر في المشروع. 
يضاف إلى ذلك أن بناء تقسيم هرمي وصيانته عادة ما يكون أيسر نسبيا وأقل تكلفة 
من توفير لغة مقيدة تقليدية كالمكنز مثلا» عندما تكون عمليات الدمج والإضافة» تتم 
بكثافة في مجال نشاط المشروع. وقد درس كل من وانج وتشوذري وخو 000000 
(2006) ممطكا كسة نومطلة© التوقعات المحتملة الأخرى بالنسبة للتقسييات 
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الهرمية في تنظيم المعلومات واسترجاعها. إلا أن أشهر مثال للتقسيم ال حرمي» هو ذلك 
المستخدم ف تجميع دليل يأهو! بماءء:01آ !ومطهلا (سعرمء.همطهئز.لل). 
التصنيفات المتعارف عليها: 

كا ألمحنا في ؟/١/‏ 4» فإن التصنيف المتعارف عليه 40115020233: يمكن 
النظر إليه بوصفه تقسي] هرميا ينشئه الجمهور أو المستفيدون (2007 ,7781 067مة77). 
ومن ناحية أخرى يبدو التصنيف المتعارف عليه متصلا اتصالا وثيقا بالتمييز 
الاجتماعي 1388128 [50013: وهو في جوهره؛ ناتج جانبي للتمييز الاجتماعي» نظرا 
لأنه يبنى بتيجان 55 يختارها المستفيدون أثناء عملية التمييز. 

وعادة ما تتخذ التصنيفات المتعارف عليها شكل سحابة التيجان 1010© 188» 
وهي تجمع مرئي للتيجان التي يتم إنشاؤهاء في موقع تمييز قائم على ترددات التيجان. 
وسحب التيجان. والتصئيفات المتعارف عليهاء إذا أردنا الدقة مترادفان. وعلى عكس 
التقسييات ال هرمية» فإن التصنيفات المتعارف عليها لا تظهر أي علاقات هرمية فيا بين 
مكوناتهاء وهي التيجان على وجه التحديد. وما تتم المحافظة عليه في التصنيفات 
المتعارف عليهاء هو العلاقة الترابطية بين التيجان» مسجلة بترتيب هجائيء دون أي 
من رموز الإحالات» التى غالبا ما تطبق ُْ اللغة المقيدة التقليدية (كالمكنز مثلا). ومن 
ثم فإن التصنيفات المتعارف عليها لا يمكن أن تعامل بالطريقة نفسهاء التي تعامل بها 
اللغات المقيدة الأخرى. التى تناولناها فعلاء من حيث تكوينهاء وبنيانها ووظيفتها. 

وفضلا عن ذلك. فإن جميع اللغات المقيدة» من خطط التصنيف إلى التقسييات 
الهرمية» عادة ما يتم تطويرها بواسطة اختصاصبي المعلومات. وفي مقابل ذلك فإن 
التصنيف المتعارف عليه ضرب جديد من لغات تنظيم المعلومات واسترجاعهاء ينشئه 
المستفيدون النهائيون لأنفسهم دون سواهم, في حركة الجيل الثاني للعنكبوتية 78/65 
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0 التي لا حدود لها من حيث الموضوع أو الثقافة أو الجغرافيا ,11211 42 علهنا81) 
(2007. وفي أثناء التمييز يمكن للمستفيدين اختيار تيجان من أي تصنيف متعارف 
عليه» ولكن تظل لهم حرية اختيار أي مصطلحات من لغتهم هم كتيجان. ونظرا لأن 
جميع التيجان في التصنيفات المتعارف عليها تربطها روابط فائقة» فإن هذا النظام يكفل 
للمستفيدين القدرة على تصفح ما هو متاح في موقع تمييز ماء عن طريق تيجان مرتبطة 
بروابط فائقة» إلى جانب البحث أو التنقيب. 

وقد نوقشت مزايا وأوجه قصور التصنيف المتعارف عليه كلغة لتنظيم 
المعلومات واسترجاعهاء باستفاضة من جانب كثير من الباحثين ( :2006 ,21نده] 
6 ,1" :2007 ,ترعاذم5 :2007 ,1165ءم5 على سبيل المثال)» وذلك من منظور 
التصنيفات المتعارف عليها فقطء أو بالإشارة إلى اللغات المقيدة التقليدية. وقصارى 
القول» فإن التصنيفات المتعارف عليها قد ورئت جميع ما للغة الطبيعية وماعليهاء 
بالإضافة إلى إحدى الخواص الإضافية للغة المقيدة» ألا وهي الترتيب الهجائي 
2 للتيجان. القائم على التردد. وبذلك المعنى» فإن التصنيف المتعارف 
عليه يستعمل كلغة طبيعية أكثر من استعماله كلغة مقيدة: في البيئة الرقمية لتنظيم 
المعلومات واسترجاعها. ومن الممكن العثور على مثال للتصنيف المتعارف عليه في 
موقع 10611010115.0012 عندما يتم تصوير إحدى سحب التيجان. 


التصنيفات التخصصية: 


يتم مصطلح علم الوجود 20200108 المستعار من مجال الفلسفة بدراسة 
الكينونة أو الوجود. وقد لجأ الباحثون ني الذكاء الاصطناعي إلى هذا,المصطلح في 
ثانينيات القرن العشرينء للدلالة على اكتساب المعرفة والتعبير عنهاء عندما يكون 
المرء بصدد وضع تصور نظري لمجال ماء في تصميم وتنفيذ النظم الخبيرة 171 
(1997. وعادة ما يعرف الوجود أو التصنيف التخصصي. في هندسة المعرفة؛ أو في 


1537 


مفاهيمي أو نظري 131123608ام0266 مشترك (1993 ,قوطنم ). 


ومن ناحية أخرى تبنى برنرز-لي» وهندلر ولاسيلا ,عمآ-5معمء8 
(2001) 15أدكة.آ 300 ,0165م216 هذا المصطلح. عند وضع تصور العنكبوتية 
الدلالية. وهذا موضوع نستكشفه في 17/ ". وفي هذه البيئة على وجه التحديدء 
ينفصل الوجود فعلا عن أصله في الفلسفة» ويحظى بالترحيب بوصفه لغة لتنظيم 
المعلومات واسترجاعها. وفي بحثهم البذري»:يتناول برنرز-لي» وهندلرء ولاسيلا 
(2001) 12زأوكهآ ههه ,0161مع11 ,وع]آ-وتعمع8 خصائص الخطط التخصصية 
15 يوصفها: 
يجموعات من العبارات المصاغة بلغة كإطار وصف 
المصادر 8101 على سبيل المثال» تحدد معالم العلاقات بين المفاهيم» 
وتحدد القواعد المنطقية لتبريرها؛ إذ يصبح بإمكان الحاسبات 
“فهم”" معنى البيانات الدلالية على صفحة العنكبوتية؛ بتتبع 
الروابط التي تفضي إلى معلومات بعينها. (38 .5) 
ويمكن للخطط التخصصية أن تتخذ أشكالا مختلفة. وقد أحصى أوشولد 
(1996) 14مطء5ت] الأشكال الأربعة التالية» التي تتراوح ما بين المتحللة من 
الرسميات إلى حد بعيد» والرسمية على نحو صارم» وذلك من منظور هندسة المعرفة. 
ويتم التعبير عن الخطط المتحطلة من الرسميات إلى حد بعيد بطريقة غير منضبطة 
لإأ10056 باللغة الطبيعية. ويأتى بعد ذلك على الطيف. الخطط التخصصية غير 
الرسمية المنتتظمة» التي تستعمل لغة طبيعية محدودة ومنتظمة. لزيادة الوضوح والحد 
من الغموض. ويسمى الشكل الثالث المعارف شبه الرسمية 5610110110281 
080108 ويتم التعبير عنها بلغة اصطناعية محددة شكلا. أما الشكل الأخير في هذا 
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الطيف فهو المعارف الرسمية على نحو صارمء التي يمكن أن تحدد بشكل شديد الدقة 
في التفاصيلء معالم اللصطلحات بعلم الدلالة الرسمي والنظريات الحزتية 
55 وعلى الرغم من غياب الوصف المعترف به لشكل التصنيف التخصصي 
على ضوء العنكبوتية الدلالية» فإن الشكل المرشح ربم| يكون النوع الرسمي على نحو 
صارم الذي رسم معالمه أوشولد (1996) 052014. 

وتشمل العلاقات بين المفاهيم في الخطط التخصصية:؛ الترادف والتضاد. 
والكلمات أو العبارات التي يدخل مجالما الدلالي ضمن المجال الدلالي لأخحرى 
لإدمدمددملاط (علاقة الكينونة 15-27') والتقسيم الهرمي الذي يعالج علاقة الجزء* 
بالكل 506708052. وغالبا ما يتم التعبير عن تلك العلاقات بالأشكال البيانية لإطار 
وصف المصادر 18101. لإنشاء العنكبوتية الدلالية (2003 ,ؤونقط611). يضاف إلى 
ذلك أن الخطط التخصصية ينبغي أن تحدد القواعد المنطقية للتبرير» حول المفاهيم 
والعلاقات الداخلة فيها بينهاء نظرا لأنها على عكس اللغات المقيدة التقليدية (كالمكانز 
مثلا) ليست ثابتة؛ إذ ينبغي أن يتوافر لها التقنية التي تدل عن التغيرات» وتنجز 
التجديدات آليا. ويمكن للخطط التخصصية بالارتباط بالمكونات الأخرى 
للعنكبوتية الدلالية» أن تجعل الحاسبات تستوعب الدلالات التي تنطوي عليها 
مصادر العنكبوتية. 

وفضلا عن ذلك فإن وظيفية الخطط التخصصية» من الواضح أنها ليست هي 
نفسها وظيفية اللغات المقيدة التقليدية (كالمكانز وخطط التصنيف مثلا)؛ فالأولى 
يقصد بها في المقام الآول» نقل الدلالات من مصادر العنكبوتية إلى الحاسبات. لا 
ضبط استعمال المصطلحات في تنظيم المعلومات واسترجاعها. ونورد في ”/١7‏ المزيد 
من مناقشات الخطط التخصصية:؛ ذلك القسم المكرس للعنكبوتية الدلالية. 
وغالبا ما ينظر إلى ورد نت (1126102.6010م.78010261) 72164 1717020 بوصفها مثالا 
للخطط التخصصية. 
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واللغة اللازمة لتنظيم المعلومات واسترجاعها في العصر الرقمي» ناشئة 
بالتأكيد» ويتم إجراء البحوث بكثافة لمعالجة قضية اللغة في المجال. وتحويل اللغات 
انطع 511 نونة[ناطة900. أحد تقنيات التحول آليا من إحدى لغات تنظيم 
المعلومات واسترجاعها إلى أخرى. عير مختلف المجالات الموضوعية» من بين مجالات 
البحث والاستكشاف» كخطة واعدة لحسم الجدل حول اللغة الطبيعية في مقابل اللغة 
المقيدة. وبمجرد أن يتم تنفيذ هذه الخطة» سوف يقع الاختيار دون تردد على استعمال 
لغة لتنظيم المعلومات واسترجاعهاء دون الاقتصار على اختيار محدد سلفاء ولن يقتصر 
الأمر على اللغة في مجال موضوعي بعينه؛ إذ يمكن للمستفيدين كسر استرقاق.أو 
استعباد تخصصاتهم القريبة» والإفادة من المعلومات العلمية بأسرها فعلاء في البحث 
(1997 ,اقطء58). ويختلف تحويل اللغات عن ”“اللغة المقيدة غير المرئية '' من ناحيتين؛ 
أولاهما أن تخويل اللغات يعتمد بكثافة على البحث في معالجة اللغة الطبيعية» 
والأخرى أن تحويل اللغات يتعامل مع لغات تنظيم المعلومات واسترجاعها في 
محالات عدة (أكثر من اثنين بكثير) بين اللغة المقيدة غير المرئية تتعامل في الأساس مع 
الترجمة بين اللغة الطبيعية وإحدى اللغات المقيدة المختزنة على الخط المباشر. فقد أنشأ 
تشن وشاتز 500212 ,ه066 وزملاؤهماء على سبيل المثال» فضاءات مفاهيم 6م0026 
65 لعشرة ملايين من مستخلصات المقالات؛ موزعة على ألف مجال موضوعي» 
تغطي العلوم والتقنية بأسرها (1997 ,5082). وفضلا عن ذلك تبين أن فضاءات 
المماهيم فعالة بالنسبة للاقتراح التفاعلي للمصطلحات. وتحويل اللغات 
(1997 .31 أء ,معطت ) . 

وقصارى القولء فإن التنظيم والاسترجاع الآليين» بدلالات قابلة للامتداد 
والتوسع 13616مء؟. يبدوان هما المستقبل» مادامت قضية اللغة في العصر الرقمي» هي 
الشغل الشاغل. ويمكن لتتابع الأحداث أن يصبح حقيقة إذا ما تطورت العنكبوتية 
الدلالية التي تصورها برنرز-لي 6.آ-8620655 وزملاؤه. 
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الفصل الخامس 
تقنيات الاسترجاع وصياغة الاستفسارات 


الآن» وقد ناقشنا قضية اللغة في تنظيم المعلومات واسترجاعها في الفصل 
الرابع» آن الأوان للانتقال إلى الموضوع التالي» وهو تقنيات الاسترجاع التي ينبغي 
وضعها في الحسبان» عند إجراء عمليات البحث. ونتناول بعد ذلك بالشرح. التعبير 
عن الاستفسارات أو صياغة الاستفسارات. 


تقنيات الاسترجاع: 

يقصد بتقنيات الاسترجاع مساعدة المستفيدين في العثور على ما مجتاجون إليه من 
معلومات» بفاعلية وكفاءة. وتتوافر للمستفيدين تقنيات متعددة نتيجة لتطور تقنيات 
المعلومات» وتقدم البحث العلمي في تقنيات اللاسترجاع. وهناك مجموعة من تقنيات 
الاسترجاع تسمى بالطرق الأساسء بينم| تسمى التقنيات الأخرى الطرق المتقدمة. 
تقنيات الاسترجاع الأساس: 

تقنيات الاسترجاعء كالبحث البوليني 8سنطءتةء5 صه80016 ومراعاة الحرف 
الأو ل من الكلمة 151637اأقصءة ع56هن). والبتر 15135214108» والبحث بالتقارب 
عستطععدء؟ ت#إنستهومء: والبحث بالحقل 568 116104 تقنيات أساس؛ نظرا 
لأها تحظى بوجه عام بالدعم من جانب معظم نظم استرجاع المعلومات. ونتناول في 
الأقسام التالية وظيفة ومقومات هذه التقنيات الأساس كلا على حدة. 
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البحث البوليني: 

كما أشرنا بإيجاز في »١/7/1١ /١‏ سمي البحث البوليني باسم عالم الرياضيات 
الإنجليزي جورج.بول 5001 ععنزمء. الذي أجرى تحليلات رياضية للمنطق. إذ 
استعمل بول ثلاثة معاملات» هى “و 1ه“ و ”أو 0#" و*“فيما عدا 2001“ 
لتلخيص العمليات المنطقية للعقل البشري» وهي جمع (و(4111) مفاهيم مختلفة 
لتكوين مفاهيم أكثر تعقدأء وفصل (في| عدا '2001) المفاهيم المركبة في مفاهيم مفردة 
أكثر بساطة (1993 ,8)ئدم58)» وتضمين (أو 012) المزيد من المفاهيم لتوسعة دلالتها. 
وتعرف كل هذه العمليات المنطقية أيضاً بالجبر البوليني. وعندما يستخدم الجبر 
البوليني في استرجاع المعلومات» تنهض المعاملات الثلاثة المساة بالمعاملات البولينية» 
بالوظائف التالية: 

© المعامل و'"4771" للحد من اتساع عملية البحث. 

« المعامل أو" ©" لتوسعة عملية البحث. 

© المعامل فيم| عدا '"1001'"' لاستبعاد النتائج غير المرغوب فيها. 


ويجمع المعامل "و 42/1" بين مصطلحين أو أكثرء في استراتيجية البحث». 
ويشترط وجود جميع المصطلحات في الوثائق التي يتم العثور عليها. ففي استراتيجية 
البحث. التصفية والجدال '53ثا 002407 4/1 عستترءغ111 على سبيل المثال» ينبغي 
الحصول فقط على النتائج حول التصفية بوصفها جدالاً. ولا يمكن لأي نتائج حول 
التصفية بوجه عام أو أي مجادلات أخرىء كالتحكم في السلاح, أن تلبي شروط 
البحث. ويفيد المعامل و "4101" على وجه الخصوص في البحث عن معلومات 
حول مفاهيم مركبة. 
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أما المعامل “أو +01“ فيوسع عملية البحث بإدخال المزيد من المصطلحات في 
سجر تعد | سق وغالباً ما تكون المصطلحات التي يتم الربط بينها مع بأو 01 
مترادفات أو مصطلحات متصلة. وينظر إلى الوثائق التي يرد بها أي من هذه 
المصطلحات بوصفها تسديدات 11165 ملائمة أو نتائج متوقعة. فمن الممكن على 
سبيل المثال لاستراتيجية بحث مكونة من “التصفية أو الجدال'“ أن تسفر عن نتائج 
حول جميع أنواع التصفية وجميع أنواع المجادلات» بالإضافة إلى الوثائق حول التصفية 
بوصفها جدالاً. ومن الواضح أن المعامل ”أو 1©'“ هيدف إلى توسعة مجال عملية 
البحثء ويزيد من ناتج الاسترجاع. 

أما المعامل '”فيها عدا 2007“ . فأكثر تقييدا بالمقارنة بكل من ”وو 
”أو “؛” ففيم| عدا" يقيد مجال عملية البحثء باستبعاد المصطاح أو المصطلحات 0 
ترد بعد المعامل "فيا عدا '؛ فمن الممكنء على سبيل المثال» لاستفسار البحث 
"التصفية في] عدا الجدال'' أن يسترجع معلومات حول جميع أنواع التصفية (كتنقية 

الماء وتنقية المواء على سبيل الكثال) مادامت ليست جدالاً. ومن الممكن استعيال 

معامل “فيا عدا '8101' 'عمداً لاستبعاد النتائج غير المرغوب فيهاء عند صياغة 
امتتقساو الدع 

وعندما يتم استعمال نوع واحد فقط من المعاملات البولينية في استراتيجية 
بحث ماء تسمى العملية بالبحث البولينى البسيط. وعندما تشتمل استراتيجية البحث 
الواحدة على أكثر من نوع واحد من المعاملات البولينية؛ تسمى العملية بالبحث 
البوليني المركب. والترتيب الطبيعي بالنسبة لمعالجة المعاملات البولينية» في معظم نظم 
استرجاع المعلومات هو: 

« أولآ معامل فيهما عدا '2]07. 

« ثانياء معامل و(4701. 


« ثالثء معامل أو 012. 
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ففي استراتيجية البحث البوليني المركب ”التصفية أو الرقابة والجدال فيا عدا 
المكتبات“ على سبيل المثال» يمكن لمعامل فيها عدا (أي الجدال فييا عدا المكتبات) أن 
يعالج أولآًء لاستبعاد أي وثائق حول الجدال المتعلق بالمكتبات» ثم يجمع المعامل 
وخ المصطلحين ”“الرقابة“ و”الجدال“ مع مفهوم ”المكتبة“ الذي استبعد فعلاً. 
وأخيراً يتم ربط مصطلح ”التصفية“ بعلاقة أو"012" بمجموعة الوثائق التي 
أسفرت عنها عمليتا البحث السابقتان. ومالم تكن نتائج عملية البحث تلبي توقعات 
المستفيد النهائي» فإنه يمكن استعمال الأقواس لتغيير الترتيب الطبيعي للمعالجنة» أو 
تحديد الترتيب المقصود للمعالحة. ففي استراتيجية البحث السابقة» على سبيل المشال» 
يمكن للمستفيد النهائي أن يستخدم الأقواس على هذا النحو: (التصفية أو الرقابة) 
و(الجدال) في) عدا المكتبات. ومن ثم فإن ترتيب المعالجة بالنسبة لهذه الاستراتيجية» 
يمكن أن يكون أو"012", وو'""43/2 ثم فيا عدا "2/01" لأن المعالجة يمكن أن 
تتبع القاعدة التي تقضي بأن تتم معالجة الأقواس الداخلية أكثر من غيرها 
111060001 أولآً تليها الأقواس الخارجية» وهكذا. ومن أن الوشائق التي يتم 
استرجاعها أن تكون حول ””التصفية“ أو ”الرقابة“ بوصفها ”جدالاً“» ولكنها لا 
تتصل *'بالمكتبات'“. وكا هو مبين» فإنه يمكن استعمال ثنائيات متعددة من الأقواس 
لتحديد ترتيب بعينه للمعالجة» في استراتيجية البحث البوليني المركب. ولهذا السبب 
أحياناً ما يسمى البحث البوليني المركب بالبوليني المسيج 5©85060. 

وكأسلوب للاسترجاع. فإن البحث البوليني هو الأسلوب الذي يستعمل إلى 
حد بعيد في الغالب الأعم؛ من جانب جميع نظم الاسترجاع القائمة. إلا أن الأمر 
يتطلب قدراً من الوقت والمارسة للتمكن من أساليب البحث البوليني» وخصوصاً 
أسلوب البحث البوليني المركب. 
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البحث بمراعاة الحرف الأول من الكلمة: 

بالنسبة للغات كالإنجليزية والفرنسية والإسبانية» التي تحدث فيها الأحرف 
الكبيرة والأحرف الصغيرة في بداية الكلمات نوعاً من الاختلاف» يكفل البحث 
بمراعاة الحرف الأول من الكلمة 106 أوم0856-5) للمستفيد النهائي القدرة على أن 
يعين على وجه التحديدء كيف يتم تمثيل المصطلح في الاستفسار والنظام؛ فالكلمتان 
أءقنة' واأءقهاء على سبيل المثال» تدلان على أمرين مختلفين. فالأولى التي تبدأ 
بحرف كبير» تدل على متجز للبيع بالتجزئة في الولايات المتحدة» بينا الثانية التي تبدأ 
بحرف صغير» ببساطة مصطلح عام يعني الحدف أو الغاية وما شابه ذلك. وبمجرد أن 
يتم التمييز بين الشكلين» يمكن للمستفيد أن يقرر ما إذا كانت هناك حاجة للبحث 
بمراعاة الحرف الأول. فإذا كان المرء ينوي البحث عن معلومات حول متتجر 
تارجت. فإن كلمة 785864 التي تبدأ بالحرف الكبير ينبغي أن يقع عليها الاختيار 
كمصطاح للبحث. ومالم يكن الأمر كذلك فإنه يمكن استعمال الكلمة 188864 التي 
تبدأ بحرف صغير. 

ويطبق البحث بمراعاة الحرف الأول من الكلمة على نطاق ضيق جداًء بالمقارنة 
بالبحث البوليني. إلا أن البحث بمراعاة الحرف الأول من الكلمة ينجز أنواعاً معينة 
من مهام الاسترجاعء لا تستطيع تقنيات الاسترجاع الأخرى إنجازها. 


البتر: 

البتر الذي يعرف أحيانا بالبدل وتغيير الشكل 099114810 والرد إلى الجذع 
8ستتصحمدة)ر. والتجريد وصأممت56. وإخفاء معالم الملصطلحات 285ل[122125 161122 
وخوارزمية الخلط تدصط):ه2150 021418105©). تقنية لاستر جاع الأشكال المختلفة 
للمصطلحات. التي يجمعها معأ جزء معين. وعادة ما تحدد نظم استرجاع المعلومات 
رمزاً بعينه (كعلامة الاستفهام؟ أو النجمة # على سبيل المثال) لأغراض الدلالة على 
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البتر. فاستعال المصطلح المبتور (*) 2647:01:1» على سبيل المثال» كاستفسار يسترجع 
الوثائق حول 265701125 والوثائق حول عصضكك26070:1. 


ويسمى بتر ععجز أو كاسعة ]ناه المصطلح. ى] سبق أن أشرناء يبتر الجانب 
الأيمن» الذي يتكفل بمععظم عمليات البتر. كذلك يمكن للبتر أن يتم أيضاً باستبعاد 
صدر الكلمة 13م أو حشوها اتا (أى بعض الأحرف التي ترد في متتصف 
المصطلح). ويسمى حذف الصدر ببتر الجانب الأيسرء بينا يسمى حذف حشو 
المصطلح بالبتر الأوسط أو الداخلي. وقلم| نجد بتر الجانب الأيسرء كا أنه لا يدعمة 
الآن سوى قليل من نظم استرجاع المعلومات. ومن الممكن استعمال البتر الأوسط 
لمعالجة المصطلحات التي يحتمل أن تكتب بأكثر من هجاء واحد. فمن الممكنء على 
سبيل المثال لمصطلح الاستفسار المبتور 01*7© أن يسترجع كلا من 0107© و16نا010©. 
وكذلك الحال أيضاً يمكن للبحث بناء على 205 *تصوع0 أن يستر جع معلومات عن 


كل من ه10 ستصمعده ردهأ هستسدعه. 


ومن المهم بتر القطاع الصحيح من المصطلح. إذا ما كان المرء ينوي استععال 
أسلوب الاسترجاع هذا. ومن الممكن أن يؤدي البتر المبالغ فيه (كبتر 6018108 إلى 
*1ق» على سبيل المثال) أن يؤدي إلى استرجاع قدر كبير من المعلومات غير المرغوب 
فيهاء ومن ناحية أخرى يمكن للبتر السجدروهجددا (كبتر عناعهلهاةء إلى تع 21810 
على سبيل المثال) ألا يحقق الهدف من البتر. ولتوفير قدر من التحكم في البترء يكفل 
كثير من نظم استرجاع المعلومات للمستفيد أيضاًء تحديد العدد الدقيق للأحرف التي 
يتم بثرهأ”©. 
(*) يتصل كل ما ورد عن البتر هنا باللغات الي تكتب من اليسار إلى اليمين. ويتصل البقر ببنية 
الكلمة أو الصرف (00108م200. وتختلف قواعد الصرف من لغة إلى أخرى؛ إذ تختلف اللغات 
الهندية الأوروبية الغروية أو اللصقية كالإنحليزية مثلاء عن اللغات السامية الاشتقاقية ومن بينها 
العربية. (المترجم) 
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البحث بالتقارب: 

بين| يمكن للمعامل و(42/1 أن يبين أي المصطلحات ينبغي أن ترد في نتائج 
البحث. فإنه لا يمكن أن يحدد مدى تباعد مواقع مصطلحات البحث هذه في الوثيقة. 
ففي صيغة البحث البولينية 'إ5اع 6021507 (آلالى قصتء!]!1) على سبيل المثال» يمكن 
للمصطلحين عسلتاء]111 و :زوع 026507» أن يردا متجاورين» أو يفصل بينههما| عدة 
مئات من الكلماتء أو في أي مكان من الوثيقة المستهدفة. ويكفل البحث بالتقارب 
مستطعءمقءد واتستدمدي الذي يعرف ايها بالبحث بالتجاور 52©3ع20[30 
8 للمستفيد القدرة على أن يحدد بدقة مدى التقاربء أو المسافة الفاصلة 
بين مصطلحي البحثء ومواقعه النسبية» باستعمال معاملي (مع 98/111) (وقريب 
+141). ويمكن لرموز البحث بالتقارب أن تختلف من نظام إلى آخر. 

ويعني معامل (مع 9811713) أن المصطلحين ينبغي أن يردا في النظام متجاورين؛ 
وبالترتيب نفسه الذي يرد في استفسار البحث. فصيغة البحث "المعلومات مع 
التقنيات" إ0108ططء»1 791111 ماق سم كما على سبيل المثال» تدل على أن 
الوثائق التي يسترجعها الاستفسار ينبغي أن تشتمل علي "تقنيات المعلومات" 
'(70108اعء1 111101123241012 كعبارة“ وليس أي شيء آخر (كالمعلومات والتقنيات 
1083مضطءع1 لسصه صمغقتصمكصلق أو ”معلومات التقنيات“ تإعه[مصطءع) 
9 على سبيل المثال). يضاف إلى ذلكء أنه يمكن لتوسعة معامل 
111 27711133 أن تشترط أن يكون المصطلحان المرتبطان بالمعامل في حندود س 
2 (2...2 و1 -82) من الكلات فيا بينهماء وبالترتيبٍ المحدد. فمن الممكن على سبيل 
المثال لصيغة البحث 10853مصطءه) 751111 2 020155 قهز أن تسترجع وثائق 


(*) مضاف ومضاف إليه هناء ويمكن للعبارة أن تكون موصوفا وصفة. (المترجم) 


1/1 


حول ”المعلومات والتقنيات'' 083[مصطءء) لصه ضمأأقدمكسدق و" المعلومات 
وتقنيات الشبكات “ 1083مططءع] عانده اعم 220 د«م11أهدم مطل وما شابه ذلك. 


ويعمل المعامل (قريب 7117412) بطريقة ممائلة» أي أن المصطلحين اللذين 
يربط بينهم| ينبغي أن يكونا متجاورين. إلا أنه على عكس المعامل (مع 9871171), فإن 
المصطلحين المرتبطين بالمعامل قريب يمكن أن يردا بأي ترتيب ماداما متجاورين. 
فصيغة البحث ”المعلومات قريب من التقنيات” 111541 ومتتمسسم/صا 
0108 ظطءء» على سبيل المثال» يمكن أن تسفر عن نتائج حول * تقنيات المعلوماث”” 
زوهامصطعءع 1‏ صمناةصممكمز أو ”معلرمات التقنيات”“ إهو[مصطء) 
600 رويشترط المعامل 51115412 أن يكون المصطلحان المرتبطان بالمعامل 
في حدود س م ''....12-م) من الكليات من بعضه)| البعض» ولكن بأي ترتيب 
كان. ومن ثم فإن الوثائق التي تشتمل على عينة العبارات التالية» جميعها نتائج ملائمة 
لصيغة البحث 1201087عع) خ1خ اا 2 دمتأهدن 10م أ: 

المعلومات والتقنيات 83 0[مصطاءع؟ 20ة ده نمدم 1سا 

المعلومات وتقنيات الشبكات '701083تاعع) غ501ا22 20 «متأقتصطترم 1سا 

التقنيات والمعلومات «متأأهقدمكصذ لصه نزعهامصطءء). 


التقنيات والمعلومات الإدارية 42072126101ط1 ؤوعسأئتاط 20غع زع م[مصطءء)]. 


والبحث بالعبارات قضلطاء:هء5 »ع25ةطم في مقابل البحث بالكليات 7010 
8 ليس سوى أحد تطبيقات البحث بالتقاربء إذا كانت المعلومات 
الأصلية التي تم تجميعها لنظم استرجاع المعلومات. قد تم تمثيلها بالكلمات فقط (أي 
تكشيف الكلمات). ولكي نكون أكثر تحديداًء فإن المعامل 78/1171 يمكن أن ينجز 
البحث بالعبارات على وجه التحديد, بين| تدعم بقية معاملات التقارب عمليات 
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البحث اعتماداً على تجاورات 005101085هالانالْ مختلفة للمصطلحات الواردة في صيغة 
البحث. كذلك يمكن للتجاورات أن تمتد خارج مدى س من الكلمات» ولكن في 
حدود الحقل نفسه أو الفقرة نفسهاء في بعض نظم استرجاع المعلومات. فنظام ديالوج 
6 على سبيل المثال» وهو نظام لاسترجاع المعلومات على الخط المباشرء 
يكفل للمستفيد القدرة على أن يشترط ضرورة ورود مصطلحات البحث في حدود 
الحقل نفسه (كحقل العنوان أو حقل المستخلص على سبيل المثال) أو الفقرة نفسها. 
البحث بالحقل: 

عادة ما يتم تنظيم معلومات الوثائق بخواص مميزة كالمؤلفء والعنوان وتاريخ 
النشر ونوع الوثيقة. وتسمى هذه الخواص المميزة بالحقول. بمجرد أن يتم التعبير عنها 
في نظم استرجاع المعلومات”. وعندما يتم تنظيم المعلومات أو الوثائق بالحقلء فإنه 
يمكن استرجاعها في] بعد بالطريقة نفسها. ويقصر البحث بالحقل» بطبيعته عمليات 
البحث على حقل واحد أو عدة حقولء بدلا من الوثيقة بأكملها. 

وينهض البححث بالحقل بوظيفتين؛ أولاهما تحديد نقطة البدء بالنسبة 
للمعلومات التي يبحث المرء عنهاء إذا كانت الخاصة المميزة للحقل (كاسم المؤلف 
مثلاً) معروفة؛ فإذا كنا نرغب على سبيل المثال في الحصول على معلومات حول أعمال 
هائز بير لون تتطنارآ “اماع28 2]5925. المتصلة باسترجاع المعلومات». فإنتا نببحث 
بالمصطلح "استرجاع المعلومات [978ع1تاء7 مه4 هدم 0/سة. إلا أننا سرعان ما يتبين 
لنا أن مثل ذلك البحث يمكن أن يسترجع. ولا شك معلومات أكثر بكثير تماكان 
متوقعاًء نظراً لأن جميع الأعمال حول استرجاع المعلوماتء بها في ذلك أعمال لون. 


(؟) عادة ما يتم في نظم استرجاع المعلومات اعداد تسجيلة .لكل وئيقة يشملها النظام. ويقسم محتوى 
التسجيلة إلى حقول» يضم كل منها عنصرا من عناصر البيانات المميزة. (المترحم) 
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سوف يتم استرجاعها كنتائج لعملية البحث. وإذا ما أجرينا عملية بحث باسم 
المؤلف, أي البحث بحقل المؤلف. فإننا يمكن أن نكون قادرين على استرجاع كل مأ 
ألف (لون) من وثائق حول استرجاع المعلومات فضلاً عن الموضوعات الأخرى. 
وحينئذ يمكننا استعمال المعامل و 47/1 للجمع بين نتائج عملية البحث السابقة 
ومصطلح ”استرجاع المعلومات“ لاستبعاد أعمال (لون) في المجالات الأخرى 
خلاف استرجاع المعلومات. 

وبالإضافة إلى ما أوضحنا توأء يمكن للبحث بالحقل أن يضيق أيضاً مجال 
عملية البحث على نحو فعال؛ لنفترض أن عملية بحث عن استرجاع المعلومات قد 
أجريت في نظام مصمم لعلم المعلوماتء فإن الناتج يمكن أن يشتمل على عدة آلاف 
من التسجيلات. وقليل من المستفيدين من يمكن أن تكون لديه الرغبة في الاطلاع 
على نتائج عمليات بحث بهذه الضخامة. وعند هذه النقطة يمكن لحقول الخنواص 
المميزة كتاريخ النشر مثلآً» أو اللغة» أو نوع الوثيقة» أن تساعد على نحو فعال في 
تضييق مجال عملية البحث. والبحث بالموضوع أو المفهوم (أي البحث ”'بحيثيات أو 
موضوع 5 ' المعلومات» متبوعاً بالبحث بالحقل (أي البحث ”يخواص 
655 * المعلومات)» من الطرق المألوفة لتنقية نتائج الاسترجاع. 


ومعظم المعلومات المتوافرة على الإنترنت. لا يتم تنظيمها بحقول اخواص 
المميزة في نظم استرجاع الإنترنت؛ نظراً للأسباب التي سبق أن تناولناها في الفمصول 
السابقة. ولهذا فإن البحث بالحقل غير قابل للتطبيق بوجه عام على استرجاع 
المعلومات من الإنترنت. إلا أن تقنيات الاسترجاع الرئيسة الأخرى التي ناقشناها في 
هذا القسمء تحظى بالدعم الكلي أو الجزئي من جانب نظم استرجاع الإنترنت» وهذه 
قضية نستكشفها بمزيد من التفصيل في الفصل الثامن» “نظم استرجاع المعلومات ". 
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أساليب الاسترجاع المتطورة: 

يتم تطبيق أساليب الاسترجاع الرئيسة التي سبق تناولها في معظم- إن لم يكن 
في كل-- نظم استرجاع المعلومات. وفي مقابل ذلك تتوافر أساليب الاسترجاع المتقدمة 
أو المتطورة 0»ع5ة807), انتقائياً» ف قطاع صغير من نظم استرجاع المعلومات القائمة» 
وذلك بعد اختبارها في مختبرات البحث العلمى. 


البحث المشوش: 

يبدو البحث المشوش 39ثتناة متصلاً بالبتر» ولكن مع اختلاف جوهري؛ فبين| 
يقصد بالبتر استرجاع مختلف أشكال المصطلح. عندما تتقاسم في| بينها بعض الأجزاء 
المشتركة» فإن البحث المشوش يقصد به العثور على المصطلحات التي حدثت أخطاء 
في هجائها عند إدخال البيانات أو إدخال الاستفسار. فمن الممكن لمصطلح 
025101 على سبيل المشال أن يمحدث خطأ في هجائه ليصبح ع1 متم أو 
1ع نا متطمء. أو 02223:667». ومن الممكن للتعرف على الأحر ف ضوليا [ه11م0 
(0012) صواتدومءءم «ماعهمرقط. والنصوص المضغوطة؛ أن يسفرا أيضاً عن 
محتوى مشحون بالأخطاء. وعلى ذلك فإن البحث المشوش مصمم على وجه 
الخصوص. لاكتشاف وتصحيح أخطاء الحجاء أو الأخطاء التي تنشأ عن التعرف على 
الأحرف ضوئياًء أو ضغط التصوص (1998 ,7عل6 1*1 © سفسردكة:6). 

وس - جرام 71-8731352 أسلوب خاص لتطبيق تقنية البحث المشوش. و س - 
جرام سلاسل متتابعة ثابتة الطول من س (س - 275 7.....س) (لل.... و و8-2) من 
أحرف المصطلح (1997 ,360:915161). أو مصطلح مفكك إلى أجزاء من الكلمات 
بحجم س. وإذا ما اتخذنا مصطلح وصئطك»568 تإتتداة كمثالء فإنه يمكن أن 
يصبح لدينا: 


17/5 


ثنائي الجرام 
55ل تلط طء ع 31 31 3ه 56 273 22 جلا 13 :(2 خم) مسوع - [8 ٠»‏ 

ثلاثفي الجرام 

8] ضلط لطء طء" ع3 "ددع 2ء5 2273 نا جدا؟ :(3حم) كلسدمع-11 ٠‏ 

وهناك أيضاً أنواع أخرى من أعداد الجرامات 505هع-5 (مثل الجرامات 
الرباعية - 8783535 41183114). أو الجرامات الخياسية 760182-5. وتصبح 1 
الأعداد من الجرامات س - جرامات»ء التي ليس من الضروري أن تمثل المعنى الدلاللي 
للمصطلح. هي الوحدات الأساس للتحقق من الأخطاء المحتملة. وحينئذ تستخدم 
خوارزميات المضاهاة لتحديد ما إذا كانت هناك مضاهاة بين التمثيل والاستفسار 
(1998 ,تعلء 11 يق سهصوده6)). وإذا كانت جميع أعداد الجرامات س- جرام 
بالنسبة لمصطلح ما تضاهي الاستفساره بينما يكون هناك واحد أو اثنان لا يضاهيان؛ 
يتم اكتشاف الخطأء ويصبح بالإمكان تقديم الناتج الصحيح. وهناك أسلوب آخر 
مألوف لتطبيق البحث المشوشء وهو المقارنة المعجمية. وذلك بمقارنة كل كلمة في 
الاستفسار يتم إدخاها في نظام استرجاع المعلومات» مقابل معجم. ويتم حينئذ 
تصويب أي خطأ يتم اكتشافه. 

وبعبارة أخرى, فإن البحث المشوش يمكن أن يتغاضى عنء أو يتسامح مع 
الأخطاء التي تقع أثناء إدخال البيانات أو إدخال الاستفسارات. ولا يمكن للوثائق 
التي تشتمل على أخطاء ناتجة عن الحجاء غير الصائبء أو أخطاء التعرف على الأحرف 
ضوئياء وما شابه ذلك من أسبابء أن تسترجع بدون تقنية البحث المشوش. 
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البحث الموزون: 

يحدث ني بعض الأحيان؛ أن يرغب المستفيد في التركيز على كل مصطلح في 
الاستفسار على نحو متفاوت؛ ففي استفسار البحث ”التصفية والجدال” عمترعال 
655 0407© لالش على سبيل المثال» يمكن أن يكون المستفيد مهتا أكثر بالجانب 
الخاص * 'بالجدال”' لا بالجانب الخاص " بالتصفية“ في حد ذاتها. وقد صمم البحث 
الموزون 761812160 لهذا الغرض على وجه التحديد. 

ولأغراض البحث الموزون يتم تحديد أوزان للمصطلحات عند صياغة 
استفسار الببحث. للدلالة على أهميتها النسبية» أو مدى تركيز المستفيد عليها. ومن 
الممكن إعطاء الأوزان في شكل رموز (كرمز النجمة # في نظام إرك ©18121* الذي 
يدل على الواصفات الرئيسة» على سبيل المثال) أو رقمياً (عشرياً وأرقام صحيحة). 
ويتم تحديد مدى الوزن (كمدى الوزن من ١‏ إلى 5» على سبيل المشال» حيث ه هي 
أعلى نقطة) على نحو يختلف من نظام إلى آخر. ويشترط بالطبع لإجراء البحث 
الموزون أن يكون الوزن قد طبق في مرحلة التنظيم» وبشكل أكشر تحديداً في مرحلة 
التكشيف. فمن الممكن على سبيل المثال في تطبيق البحث الموزون على الاستفسار 
”“التضفية " والجدال " لإكتاء09عاصمء الى 3 وستى غ51 أن يتوقع المستفيد 
الحصول على الوثائق التي تم فيها تسجيل هذين المصطلحين باستعمال مقياس الوزن 
نفسه؛ أي تحديد الوزنين 7و للمصطلحين '”التصفية“ و”الجدال'' على التوالي. 

ومن الممكن استعمال الغتبة 8558010 وهي مفهوم مرتبط ارتباطاً وثيقاً 
بالبحث الموزون. لتحديد متى تلبي نتائج عملية البحث شروط الاستفسار الموزون. 
فإذا افترضنا أن كانت العتبة بالنسبة لعملية البحث “التصفية والجدال + * 


(*)مرصد بيانات متخصص ف التربية وما يتصل كا. (المترحم) 
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6 لإواء 1707دمء (1للخ 3 عسأترء]111 قد وضعت عند 4» حينئذ لا يمكن النظر لأي 
نتائج بعتبة أقل من 4 (كوثيقة في الموضوع نفسه ولكن بوزن ” بالنسبة ”للتصفية“ 
وه بالنسبة للجدال على سبيل المثال) بوصفها صا حة في هذه ال حالة. 

وما لاشك فيه أن إقرار الوزن ليتم تحديده للمصطلحات»؛ أمر حاسم في 
البحث الموزون. وهناك خوارزميات وزن مختلفة تستخدم فعلاً؛ وموقع المصطلح» 
وتقارب المصطلح.ء وتردد المصطلح (4)» والتردد العكسي للوثيقة 0)» وتقدير 
الفرد» هي المعايير الأساس بالنسبة لتحديد الأوزان. إلا أن من بين تلك المعايير؛ 
وخصوصاً تقدير الفرد» أو الطريقة الحتمية أو القطعية عناوتستصمع)»0 ,29015) 
(1997 ما يمكن تطبيقه عملياًء للبحث الموزون. نظراً لأن المستفيد حين قام بتحديد 
الأوزان لمصطلحات الاستفسارء لم يكن على دراية بالوثائق التي يمكن استرجاعها. 
إلا أن جميع المعايير الأخرى الخاصة بتحديد الأوزان» تتوقف على خحواص 
المصطلحات المقتبسة أو المقتطفة من الوثائق الأصلية. ولمذاء فإن أساليب الوزن 
القائمة على موقع المصطلح. والمعايير الأخرى لا تبدو قابلة للتطبيق إلا على التكشيف 
الوزون ققط 

ويبدو البحث الموزون القائم على القرار الفردي. ذاتيا جدا. إلا أن تطبيقه 
يعتمد فعلاً أيضاً على الجمع بين عوامل كالحاجة إلى المعلومات» وطبيعة نظم استرجاع 
المعلومات» وأنواع التتائج المتوقعة. وبعبارة أخرىء فإن المستفيد هو من يقرر الأوزان 
بالنسبة لمصطلحات الاستفسار. واضعا تلك العوامل المحددة في الحسبان, ولهذا فإن 
تخصيص الأوزان في أثناء صياغة الاستفسار» ليس مجرد مهمة تعسفية. 

وكما سبق أن بينا فإن هناك معايير لتحديد الأوزان» يمكن الاختيار من بينهاء 
من أجل التكشيف الموزون. أكثر تما هو متاح بالنسبة للبحث الموزون. ومن بين تلبك 
المعايير» دلالة موقع المصطلح على مكان ورود المصطلح في الوثيقة. وكقاعدة لا محيد 
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عنهاء فإن المصطلح الذي يرد في أماكن كالعنوان» أو عناوين الأقسام, والجمل 
الموضوعية 5615165665 ©401: يمكن أن يحظى بوزن أعلى من تلك المصطلحات التي 
ترد في أقسام أخرى من الوثيقة. ويعني تقارب المصطلحات تلك المسافة الفاصلة بين 
مضطليحات التجعيق فق الوثيقة: ويمكة القول بوجعاب آنا كل عتافك السافة: 
أو كلما ازداد التقارب بين المصطلحات موضوع النظرء ارتفع وزن التكشيف الذي 
يمكن أن تحظى به المصطلحات. ومن ناحية أخرىء فإن تردد المصطلح (ت م 16) 
يُعرّف بوصفه عدد المرات التي يرد بها المصطلح في وثيقة ما. وى) أوضحنا من قبل»» 
فإن المصطلحات عالية التردد فقط» ليست بالضرورة مصطلحات تكشيف مرشحة 
جيدة» لأنها يمكن أن تكون كلمات وظيفية أو نحوية؛ أو كلمات لا تحمل معنى مهما 
في الاسترجاع. وفي مقابل ذلك. فإن أفضل مصطلحات كشفية» أو تلك المصطلحات 
التي يمكن أن تحظى بأوزان عالية» هي تلك التي ترد بكثافة في وثائق بعينهاء ونادراً ما 
ترد في بقية وثائق مرصد البيانات (1989 ,581408). ومن ثم فإن عدد الوثائق التي 
يخصص ا مصطلح معينء ينبغي أن يوضع فى الحسبان عند إقرار الأوزان. ويعرف 
هذا الأسلوب بالتردد العكسي للوثائق 06) لع معدوعم؟ امعتسسعه0 عدي حول 
نظراً لأن الأوزان التي يتم تحديدها تتناسب عكسيا مع تردد الوثائق. ويعني ذلك على 
وجه التحديدء أنه كلما قلت الوثائق التي يخصص أو يعين لا المصطلح, ارتفع الوزن 
الذي تحظى به. 

ولما كان تردد المصطلحات غالباً ما يستعمل مرتبطأ بالتردد العكسي للوثائق» 
لتحديد الوزن الذي يمكن أن تحظى به المصطلحاتء فإن هذا الأسلوب يسمى 
أسلوب الوزن بناء على تردد المصطلحات. والتردد العكسي للوثائق. وطول الوثيقة 
(ط و41) أحياناً ما يوضع أيضاً في الحسبان جنباً إلى جنب مع أسلوب الوزن. بناء 
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على تردد المصطلحات والتردد العكسي للوثائق» وذلك لإضافة معيار آخر في إقرار 
أوزان المصطلحات. وإذا ماظل كل من تردد المصطلح والتردد العكسي للوشائق 
ابتين» فإنه كلما طالت الوثيقة التي تشتمل على المصظلحء ارتفع الوزن الذي يمكن أن 
يحظى به المصطلح. وقد.اتبع أسلوب الوزن بناء على تردد المصطلحات والتردد 
العكسي للوثائق وطول الوثيقة» على نطاق واضعء في مشروع مؤتمرات استرجاع 
النصوص (تر كك 11350 81051691 انعط (2000 ,ومعصمل عاءسقمم) 
عع لاع 00101 ونقدم مناقشة تفصيلية لسلسلة ترك :1181800 في الفصل الحادي عش. 

وتستخدم أساليب وزن أخرىء كأساليب الاحتالات. في التطبيقات العملية 
أيضاً. وفضلاً عن ذلكء فإن أساليب الوزن هذه؛ غالباً ما تطبق في تجمغات مختلفة مع 
طرق أخرى؛ فمن الممكن على سبيل المثال. تطبيق أسلوب موقع المصطلح جنباً إلى 
جنب مع تقارب المصطلحات في إحدى خوارزميات الوزن. ويمهد البحث الموزون 
انسبياد اكور للاسترجاع الفعال للمعلومات. 
توسعة الاستفسارات: 

حتى وإن حظيت صياغة الاستفسار بالتفكير العميق» وهذا موضوع نستكشفه 
بمزيد من التفصيل في القسم 0/ "0 فإنه لا يمكن للمستفيد أن يضمن عدم حاجة 
استفسار البحث إلى المراجعة أو التوسعة؛ بمجرد الانتهاء من صياغته. وتوسعة 
الاستفسارات أسلوب للاسترجاع, يكفل للمستفيد النهائي فرصة الارتفاع بمستوى 
الأداء» بمراجعة استفسارات البحث بناء على النتائج التي تسترجع فعلاً. وعمليات 
البحث اعتمادا على توسعة الاستفسار تكرارية وتفاعلية» كما يتتضح في الشكل 
رقم ١/0‏ . 
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الشكل رقم 5/ ١‏ عملية توسعة الاستفسارات 


ويتم فحص النتائج التي يتم الحصول عليها من عمليات البحث. بعد تقديم 
كل استفسارء لتبين ما إذا كان من الممكن التقاط أي معلومات من هذه النتنائج» 
وتضمينها في صياغة جديدة للاستفسار. ومن الممكن نظريا تكرار عملية توسعة 
الاستفسارات إلى أن يتم الحصول على نسائج مرضية. ويمكن للتفاعل بين نظام 
استرجاع المعلومات والمستفيد, أثناء عملية توسعة الاستفسارات؛ أن يساعد على 
الارتفاع بمستوى أداء الاسترجاع. 

وكا ذهب رسنك وفوهان (2006) ,مقطونة7؟ 200 عاءثهدء 28 فإن توسعة 
الاستفسارات إحدى الطرق التي تتبع عموماً في السياق. والأسلوب الآخر هو 
تقليص,_ أو انكهاش الاستفسارات. وتنطوي توسعة الاستفسارات على إضافة 
مترادفات أو مصطلحات متصلة أخرى إلى الاستفسارات بمعامل ”أو“ . لزيادة عدد 
حالات المضاهاة التي يتم تحديد معالمهاء بين| دف تقليص الاستفسارات إلى 
التخلص من غموض أي مصطلحات متعددة المعاني» منن أجل ضمان استرجاع 
حالات المضاهاة المناسبة دون سواها. ومن الممكن تقسيم توسعة:الاستفسارات إلى 
ثلاث فئات. بناء على المصادر التي يتم منها اختيار المصطلحات المتصلة من أجل 
التوسعة (1999 ,12810808 رقطة178 رطءناة)). وعلى وجه التحديد,. فإن 
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التوسعة اعتهاداً على مصطلحات منتقاة من مجموعة فرعية من الوثائق المسترجعة؛ بناء 
على استفسار بعينه» تسمى التوسعة بناء على استفسار معين ©113ع©1©132-52ان. وإذا ما 
تمت التوسعة بمصطلحات أمكن التحقق منها عن طريق تحليل محتويات مرصد بعينه 
للنصوص الكاملة. فإنها هنا توسعة بناء على رصيد معين ©152أععم5-كتنام2م». وإذا ما 
تمت التوسعة بمصطلحات واردة في مكانز على الخط المباشر» لم يصمم خصيصا لأي 
مجموعة بعينهاء فإنها تسمى التوسعة بناء على لغة معينة عألأع©م1211503286-5. 

ومن الممكن تنفيذ توسعة الاستفسارات يدويا أو آليا. وبالنسبة للتوسعة 
اليدوية للاستفسارات» يقرر المستفيد كيف يمكن الإفادة من نتائج عملية البحث» ' 
لكي يعدل الاستفسار. وبالنسبة للتوسعة الآلية للاستفسار (التي تعرف أيضا بالتلقيم 
المرتد للصلاحية ءاع 1660 ععصه16»7»") فإنه يفترض أن تكون الوثائق المتربعة على 
"القبة ق تائع عولة لسكدعاللة يوون كي ترافى فق مزاج الاستفصان: ولا 
يشارك المستفيد النهائي على نحو مباشر في عملية تعديل الاستفسار © 0555382 6) 
(1970 ,دهغ521 :1998 ,1516067. وعند هذه النقطة يمكننا أن نلاحظ أن توسعة 
الاستفسارات» ليست بالتعبير بالغ الدقة للدلالة على هذه العملية» نظراً لأن 
الاستفسار لن يتسع بالضرورة» وإنما يتعرض للتعديل دائياً. ومن ثم فإن تعديل 
الأمتفساز اك يدو معطلحا افر ملءمة والقسية ذه العملية: 

وهناك أسلوب آخر لتعديل الاستفسارات» يحظى أيضاً بالتأييد» ويتم تطبيقه 
فعلاً من جانب بعض نظم استرجاع المعلومات؛ ففي هذا الأسلوب ترد المصطلحات 
آليا في قائمة خيارات 706813 منسدلة» كاقتراحات. بين| يقوم المستفيد بإدحال 
الاستفسار في صندوق البحث. وعلى الرغم من أن بعض المستفيدين قد يجدون هذا 
الأسلوب غير مشجع. يدعي آخرون (مثل 2006 ,تصتصمخطءمه81 :هع عافط99) أنه 
من الممكن لمثل هذا الأسلوب أن يدعم فعلاً التوسعة الفورية للاستفسارات. 
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وترتيب المخرجات طبقياًء الذي يتم في كثير من نظم استرجاع المعلومات» 
أسلوب مهم أساس بالنسبة للتلقيم المرتد للصلاحية؛ أو توسعة الاستفسارات آليا. 
وعلى نحو مماثل لأساليب الوزن التي سبقت مناقشتهاء فإن خوارزميات الترتيب 
. الطبقي تستند» في أغلب الأحيان على معايير من قبيل موقع المصطلح. وتقارب 
المصطلحء وتردد المصطلح. وعادة ما يطبق كل نظام لاسترجاع المعلومات 
خوارزميات الترتيب الطبقي الخاصة به باختيار معايير معينة. ومشل خوارزميات 
الترتيب الطبقي هذه لا تنشر أو تتاح على الملأ عادة. وهناك معيار ترتيب طبقي 
جديد» يسمى أسلوب الرابطة الراجعة ع1هذاءا59 أدخله عام ١948‏ جوجل 
عاع200). أحد نظم استرجاع معلومات الإنترنت. لترتيب نتائج البحث في 
العنكبوتية العالمية طبقياً (1999 ,17145381). ويحكم أسلوب الرابطة الراجعة على 
جودة صفحة العتكبوتية» بإحصاء عدد مواقع العنكبوتية الأخرى التي توفر روابط 
فائقة 5ك[ط511:»مقط مبذه الصفحة؛ وذلك من بين أشياء أخرى. وهناك المزيد من 
مناقشات أسلوب الرابطة الراجعة» في الفصل الثامن “نظم استرجاع المعلومات". 

والاستفسار با مثال عاصتههنا» لإط لإ#عتاقو أسلوب آخر لتوسعة 
الاستفسارات» حيث يدل مصطلح ”مثال'“ على النتائج التي استرجعت فعلاً؛ 
وبعبارة أخرى. فإن النتائج التي يتم استرجاعهاء تعامل بوصفها أمثلة للمزيد من 
الاستفسارات. وفي نظم استرجاع الأصوات والصوره يمكن للمثال أن يأتي مباشرة 
من المستفيد. كالمخطط المرسوم باليد لزهرة؛ لا من المعلومات المقتطفة من نتائج عملية 
البحث. وعند البحث في الإنترنت» يمكن للمستفيد التعبير عن تلقيم الصلاحية 
المرتد» بالنقر ببساطة على الروابط الفائقة مثل '“المزيد مثل هذا أو المزيد من هذا القبيل 
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وغالباً ما تدعو الحاجة إلى تعديل الاستفسارات في استرجاع المعلومات» لأنه 
يمكن لهذا التعديل أن يرتفع بمستوى أداء الاسترجاع» وذلك بمراجعة استفسار 
عملية البحث استناداً إلى المصطلحات المقترحة في صندوق عملية البحثء أو النتائج 
التي تم الحصول عليها فعلاً. وكأساليب للاسترجاعء فإن توسعة الاستفسارات 
وتلقيم الصلاحية المرتد على وجه اللخصوصء يتمتعان بالتطبيق على نطاق واسعء 
فضلاً عن الاحتمالات المستقبلية العريضة في استرجاع المعلومات في العصر الرقمي. 
البحث فبي مراصد بيانات متعددة: 

يعني البحث في مراصد بيانات متعددة» الذي يعرف أيضاً بالبحث الموحد 
4 البحث تزامنيًا في أكثر من نظام واحد لاسترجاع المعلومات. وينظر إلى 
مصطلح مرصد البيانات هنا عادة بوصفه مرادفاً للنظام”. والحاجة إلى البحث في 
مراصد بيانات متعددة, ثلاثية الأبعاد؛ فمن الممكنء أولاً» البحث في نظام واحد 
لاسترجاع المعلومات» ألا يسفر عن ما يبحث عنه المستفيد» لأن لكل نظام لاسترجاع 
المعلومات حدود التغطية الخاصة به والتوجه والمقومات أو المنواص. وفي هذه الحالة 
ينبغي اللجوء إلى نظم أخرى لاسترجاع المعلومات من أجل عملية البحث. ثانياً 
يمكن للبحث في مراصد بيانات متعددة أن يكون بمثابة أداة اختيارء إذا لم يكن 
المستفيد متيقناً من أي النظم يمكن أن يكون الخيار الأفضل بالنسبة لاستفسار بعينه. 
ثالثاء يمكن للنتائج التي يتم الحصول عليها من البحث في مراصد بيانات متعسددة 
أن توحي أيضاً أو تدل على النظم الملائمة للمستفيد» لإجراء المزيد من عمليات 
الجحت فيهنا: 


) وقد مع المؤلفة في ذلك» لأن مرصد البيانات 0886856 يمكن أن يكون أحد مكونات نظام 
ستر جا ع المعلومات. وبعبارة أخرى» فإن نظام الاسترجاع لا يقتصر على مرصد البيانات. )1 لترجم) 
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عند البحث في مراصد بيانات متعددة؛ على المرء أن ينتبه» على وجه اللخصوص 
لأوجه الاختلاف في نَظْم 59421 الاستفساراتء واللغة» وإمكانات البحث التي 
يكفلها كل نظام؛ فمن الممكن لخاصية مألوفة وأساس في نظام ماء أن لا تحظى 
بالمساندة في نظم أخرى. وفضلاً عن ذلكء فإنه يمكن للخاصية نفسها التي تحظى 
بالدعم في كل النظمء ألا يتم التعبير عنها بالطريقة نفسها. فمن الممكبن؛ على سبيل 
المثال» للمعامل البوليني و41 أن يستخدم في نظام ماء بين]| يستخدم نظام آخر 
علامة زائد. كذلك يمكن للغات المستخدمة في النظم المتعددة أن تكون مختلفة أيضا. 
وتشمل الاحتمالات. اللغة الطبيعية في مقابل اللغة المقيدة» واللغات المقيدة المختلفة» 
واللغة الطبيعية المستعملة في مجالات تخصصية مختلفة. ش 
وهناك تحد آخر يواجهه البحث في مراصد بيانات متعددة» وهو كيفية معاملة 
البيانات مختلفة الصيغ 1080815 (مثل آسكي 456©11» والفهرسة المقروءة آلياً [مارك 
140 ). المختزنة في مراصد بيانات متعددة. وزد 4.5٠‏ 239.50 مواصفة 
معيارية للتعريف بخدمة استرجاع المعلوماتء وتحديد مواصفات البروتوكول 
210 2010201 بالنسبة لتطبيقات المكتيات» وضعت لعالجحة البيانات 
بجميع الصيغ لأغراض الاسترجاع؛ وذلك من بين أشياء أخرى. ومن ثم فإن نظم 
استرجاع المعلومات الملتزمة بالمواصفة المعيارية زد 4.5٠‏ 7» يُمكن البحث فيها 
تزامنيء بصرف النظر عن أوجه الاختلاف في الصيغ والتقارب الجغراني و اعد»091) 
(1995 وتلءقناطءهم131 2#. ولما كانت قد أقرت من جانب المعهد الوطنى الأمريكى 
للمواصفات المعيارية (آنسى آكالة). لعدفصهاك لمممتلها1 مقتمعصسة 
كسك والمنظمة الوقائية للموا قات المعيارية للمعلومات (نيزو 11150) 
11 527103105 121013211011 اهدده )12 فإن زد » 94.6؟ تطبق 
على نطاق واسع في الفهارس المتاحة للجمهور على الخط المباشره اعتاداً عل 
العنكبوتية العالمية 5 ,124:60 © 5604هها-ماء177 (وبباكس 52©5تا177)» وبعض الأنواع 
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الأخرى من نظم استرجاع المعلومات. واعتماداً على زد 74.0٠‏ يمكن للمستفيد أن 
يسترجع هنا المعلومات باستخدام واجهة تعامل 1214611866 موحدة الشكل» أيأ 
كانت واجهة التعامل التي توافرت للنظام في الأصل. 

وانطلاقاً من زد "9.6٠‏ واستجابة للتوقعات التقنية الراهنة» فإن خدمة 
العنكبوتية للبحث والاسترجاع (518177) عمذج5 مك17 عع اع[ لطسوءف 
والبحث والاسترجاع عن طريق المحدد الموحد لمكان المصدر 76عتتاءخالطءمروء5 
(51810) :11181 518 بروتوكولان قصد بي| تحديد معالم شكل معياري لاستفسارات 
البحث في الإنترنت» وكذلك بنيان الاستجابات. فعندما يقدم المستفيدون الاستفسار 
نفسه لعدة نظم لاسترجاع المعلومات. فإن النظم 8 الذي يعير عن الاستفسار 
يمكن أن يكون مختلفآء وكذلك ال حال أيضا بالنسبة لبنيان الاستجابات؛ إذ تشتمل كل 
استجابة لا على نتائج عملية البحث فحسب. وإنم| على معلومات الصياغة أيضاً. 
ويعالج كل من خدمة العنكبوتية للبحث والاسترجاع 51857 والبحث والاسترجاع 
عن طريق المحدد الموحد لمكان المصدر [5181» اللذان يسميان إختصاراً [251295//1 
هذه المشكلات» وذلك بتحديد مواصفات التَظم 595087 بالنسبة للاستفسارات 
والنتائج؛ فهذان الأسلوبان [51455//0 يكفلان, على وجه التحديد» للمستفيدين» 
ومتعهدي نظم استرجاع المعلومات» إمكانية توجيه الاستفسارات لمراصد بيانات 
الإنترنت» وإعادة النتائج المسترجعة بسلاسة؛ دون الحاجة إلى بروتوكولات ما وراء 
البحث 015ع5010م 2اعهع126185 المعقدة» كالمواصفة المعيارية زد "4.65٠‏ على سبيل 
المثال (2004 وتهع0/0). فبالمقارنة مبذه الاخيرة» فإن [51299/1 أقل تعقداًء وإن 
كانت تقابل دلالياً المواصفة المعيارية زد 9.6٠‏ الكلاسيكية (2003 ,5هاعنآ). 
وتعمل مكتبة الكونجرس غلى نشر 8179/17 وما يتصل به من مواصفات معيارية 
(2008 ووو5ع20281) 01 7ه 7طاط). 
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وفضلاً عما سبق ذكره من مشكلات وتحديات» ترتبط بالبحث في مراصد 
بيانات متعددة» فإن سبيل دمج النتائج المسترجعة من عدة.مراصد بيانات» يفرض 
تحدياً آخرء فالمخرجات المرتبة ة طبقيأًء على سبيل المثال» في سبيلها لأن تصبح., وعلى 
نحو متزايد هي القاعدة في تقنديم نتائج عمليات البحث. ولا تزال خوارزميات 
الترتيب الطبقي تختلف من نظام إلى آخر. ولا يمكن توقع أن يكون الترتيب الطبقي 
٠.‏ لإحدى الوثاتق المسترجعة من أحد النظم هو نفسه الخاص بالترتيب الطبقي 
من نظام مختلف. ويبدو انصهار البيانات أو اندماجهاء أي الجمع بين التتائج 
المسترجعة من نظم مختلفة» اعتمادا على طرق معينة» حلا محتملاً لمذه المشكلة. فقد 
اقترح بلكن ذكلا»8 وزملاؤه (1995)» على سبيل المشال» مجموعة من الأساليب 
الخاصة بدمج نتائج عدة استراتيجيات بحث. في عدة مراصد بيانات» لإنتاج أفضل 
استجابة ممكنة لأحد الاستفسارات. ومسار دمج مراصد البيانات ع5ة80غة2 
عآع 12 8ه في مشروع مؤتمرات استرجاع النصوص (ترك 11830" الذي 
نتناوله في الفصل الحادي عشر» مخحصص أو مكرس للتصدي لمشكلة دمج البيانات 
الواردة من مصادر غير متجانسة» لتقديم مخرجات موحدة © ووعط7002؟) 
(2000 112121335 . 

وعادة ما يحظى البحث في مراصد بيانات متعددة بالدعم» من جانب مرافق أو 
متعهدي استرجاع المعلومات (مثل ديالوج 801410602)» التي تدير مراصد بيانات 
متعددة» وليس نظاماً واحداً لاسترجاع المعلومات. وينهض ما يسمى ما وراء 
محركات البحث على الإنترنت» بوظيفة ممائلة بالنسبة لاسترجاع المعلومات من مصادر 
مختلفة على الإنترنت. وظارائعةا الرصوع بدزية م الفميل لي البصل الاين 
“نظم استرجاع المعلومات". 
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اخديار تفنيات الاسترجاع: 

هناك» ى) تبين في القسم السابق» تقنيات استرجاع مختلفة» يمكن للمستفيد 
النهائي أن يختار من بينها ما يناسب مهمة بحث معينة.“وهناك كثير من العوامل التي 
ينبغي أن توضع في الحسبان عند اختيار تقنيات الاسترجاع. إلا أنه في هذا القسم تركز 
مناقشة اختيار تقنيات الاسترجاعء على وظائف هذه التقنيات وأدائها في الاسترجاع. 


وظائف تقنيات الاسترجاع: 


تعمل كل واحدة من تقنيات الاسترجاع بطريقة معينة» بحيث يمكن للمستفيد 
الاعتماد عليها لتحقيق أهداف البحث الملائمة؛ فاستعمال البتر» على سبيل المشال» 
يسترجع مختلف أشكال المصطلحاتء إذا كانت تتقاسم قطاعات مشتركة في طرق 
هجائها. وفي مقابل ذلك يستوعب البحث المشوش أخطاء الحجاء وناتج التحقق من 
الأحرف ضوثياً 00:18). إذا ما كان من الممكن أن تكون هناك بعض حالات المضاهاة 
بين الشكلين المختلفين للمصطلح. ولهذاء فإن أول سؤال يتبغي أن يطرحه المستفيد عند 
اختيار تقنية الاسترجاعء يتعلق با يمكن لتقنية الاسترجاع (كالبحث الموزون على سبيل 
المثال) أن تنجزه. ولا يمكن للمستفيد أن يعرف ما إذا كانت تقنية الاسترجاع موضوع 
النظر مناسبة لاستفسار معين. إلا بعد الإجابة عن هذا الاستفسار. 
أداء الاسترجاع: 

يقاس أداء الاستر. جاع سا وفي معظم الأحيان» بالتحقيق 102واءع27 
والاستدعاء 16811 على الرغم من أن هذين المقياسين يشكلان دائمأ بؤرة مناقشات 
جدلية. ولأغراض التوضيح تركز المناقشة التالية على التحقيق والاستدعاء كمقياسين 
لأداء الاسترجاع.ء بين ننظر في وجهات النظر المختلفة حوطماء في الفصل الحادي عشر 
“تقييم نظم استرجاع المعلومات . 
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ويعرّف التحقيق بأنه نسبة عدد الوثائق الصا حة المسترجعة إلى مجموع الوثائق 
المسترجعة من نظام ما. ويقيس التحقيق قدرة نظام استرجاع المعلومات على التمييز؛ 
أي القدرة على فصل غير الصالح عن الصالح. فإذا تم استرجاع مئة وثيقة بعملية 
بحث ماء وحكم على 70 منها بأبا صالحة» فإن معدل التحقيق بالنسبة لعملية البحث 
هذه يكون 0" بالمئة. ويعرّف الاستدعاء» من ناحية أخرى. بوصفه نسبة عدد الوثائق 
الصالحة المسترجعة إلى إجمالي عدد الوثائق الصا حة في نظام ما؛ فهو يقيس القدرة 
الاسترجاعية لنظام استرجاع المعلومات. فإذا افترضنا أن هناك مئة وثيقة صالحة.” 
حول موضوع معين في نظام ماء وتم اسثرجاع 445 منهاء حينئذ يمكن لمعدل 
الاستدعاء لعملية البحث هذه أن يكون 5: بالمئة. وبالنسبة لكل من التحقيق 
والاستدعاء, فإنه كلم) ارتفعت النسبة المئوية كان أداء الاسترجاع أفضل. إلا أنه من 
المستحيل الحصول على نتائج بحث مرتفعة في كل من التحقيق والاستدعاءء. نظراً 
لعلاقة التناسب العكسي بين المقياسين. 

وفي حدود ما يهم أداء الاسترجاع؛ فإن جميع تقنيات الاسترجاع التي نوقشت 
في القسم 2١/6‏ يمكن تصنيفها بوصفها تؤدي إلى الارتفاع بمستوى التحقيق 
(كالمعامل البوليني و1152ى» والبحث الموزون) أو تؤدي إلى الارتفاع بمستوى 
الاستدعاء (كالمعامل البوليني أو 01)» والبحث المشوش)*. ومن ثم فإن قرار اختيار 
تقنيات الاسترجاع ينبغي أن يتم اتخاذه واضعين في الحسبان أداء الاسترجاع الذي 
يتوقعه المستفيد. فإذا كانت نتائج البحث عالية التحقيق هي المتوقعة؛ فإنه يتعين اختيار 
تقنيات الاسترجاع المقابلة» والعكس صحيح. أي أنه إذا كانت نعائج. البحث عالية 
الاستدعاء هي المتوقعة» فإنه يتعين اختيار تقنيات الاسترجاع المقايلة. . 


(*) يمكن أن يضاف هنا البتر. (المترجم) 
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تقنئيات الاسترجاع والارتفاع بمستوى التحقيق: 

يؤدي المعامل البوليني (و(47/1)إلى الارتفاع بمستوى التحقيق» وذلك بالجمع 
بين مصطلحين أو أكثر في استفسار.البحث» من أجل تحديد المضمون الدقيق لهذا 
الاستفسار. فإذا كانت هناك» على سبيل المثال» ثلاثة مصطلحات هي التصفية» 
والجدال» والعنكبوتية طا©/17 8520 '0840955© ,1516611138 في استفسار بحث ماء 
فإنه يمكن الحصول على نتائج دقيقة بجمع ”41/2108“ المصطلحات الثلاثة كلها 
معاً. وإذا ما تضمن استفسار البحث مصطلحين فقطء فإن النتائج يمكن أن تزيد في 
العدد. ولكنها تتراجع في التحقيق» نظراً لأن القيد على المصطلح الثالث قد رفع. 

أما المعامل البوليني (في| عدا '801) فيرتفع بمستوى التحقيق باستبعاد 
المصطلحات غير المرغوب فيها من الاستفسار. فإذا افترضنا أن المستفيد يريد البحث عن 
وثائق حول جدال التصفية» فيم| يتعلق بالمواد المتؤافرة في العنكبوتية» ولكن ليس حول 
برامج التلفزة» فإنه من الممكن استعمال المعامل فيم| عدا '8801 لتحقيق ذلك المهدف. 

ويؤدي البحث بمراعاة شكل الحرف الأول ©"ناأقمء0856-5 إلى زيادة 
التحقيق» وذلك بالتمييز بين الكلمات التي تبدأبحرف كبير 685 “ا»ممتاء وتلك 
التي تبدأ بحرف صغير 8596© 10796#. ويوضح المصطلحان تارجت )18186 و 
81 1 هذه النقطة؛ فإذا كان المستفيد لا يبتم إلا بالعثور على الوثائق حول متجر 
تارجت 56056 2188616 فإن البحث بمراعاة شكل الحرف الأول يمكن أن يسترجع 
ما يريده المستفيد على وجه الدقة. ومالم يكن نظام استرجاع المعلومات يدعم البحث 
بمراعاة شكل الحرف الأولء فإنه لا يمكن للمستفيد أن يجد سبيلاً للتمييز بين 
الشكلين المجائيين للمصطلح. ومن ثم فإن الوثائق حول كل من متجر تارجت 
1318 وهدف 185866 يتم استرجاعها بوصفها نتائج مشروعة؛ ويتأثر معدل تحقيق 
عملية البحث سلبا. 
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ومعامل مع" 31 الخاص بالبحث بالتقارب» طريقة أيضاً للارتفاع 
مجر ماحد ار راك لدو رار يلاي سورك الموطانة حلفي يوطي 
المعامل ”مع“ في الوثيقة الأصلية أو بديلها. فإذا كانت صيغة البحث هي: 
"المعلومات مع التقنيات (108مصطءءة 701111 صمنأق سمل فإن هذين 
المصطلحين يتعين أن يردا بالترتيب نفسه في نظام الاسترجاع. ويمكن لأي تجميعات 
أخرى للمصطلحات (معلوممات التقنيات. والمعلومات والتقنيات [6020108) 
كسار 1083مططاعع1 لصة ج105 دطمكصاء على سبيل المكال)ء الا كتمفن 
عن نتائج دقيقة؛ وإنما عن شوشرة 20196 في عملية البحث. ويعمل المعامل س 5 
3 عل النحو نفسه. الذي يعمل به المعامل مع 298/1111 في| يتعلق بالارتفاع 
بمستوى التحقيقء إلا أنه يكفل تفاوتاً في مدى س من الكلمات بين المصطلحين 
اللذين يربط المعامل بينهما. 

ويكفل البحث بالحقل دقة عملية البحث» وذلك بقصرها على حقل بعينه. 
فكل حقل لمخصص للدلالة على إحدى الخصائص المميزة للوثائق. وإذا كان 
الاستفسار حول إحدى خصائص الوثيقة ا على سبيل المثال)؛ فإنه من شأن 
عملية البحث أن تكون أكثر دقة» إذا كانت على ذلك الحقلء ممايمكن أن 
تكون عليه عندما نجري بحثاً شاملاً في - 0 ع الممكن للحقول الأخرى 
أن تشتمل على اسم المؤلف لأسباب مختلفة» إلا أن هذه الحقول لم يقصد بها التعبير عن 
مسئولية تأليف الوثائق. 

ويحدد البحث الموزون» وهو أسلوب آخر للارتفاع بمستوى التحقيق» أوزاناً 
لمصطلحات الاستفسار. ومادام الأمر كذلكء فإنه بمقدور المستفيد تحديد نقاط تركيز 
الاستفسار» وبذلك يحصل على نتائج تضاهي توقعاته على نحو أكثر دقة. ولنأخذ 
صيغة عملية البحث التصفنة والجدال * 40967559دم» الى عستعغ1: كمثال 
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ثانية. فبإمكان المستفيد الإعراب عن التركيز على كل من المصطلحين بطريقة مختلفة» 
وذلك بتحديد وزنين مختلفين لما. وإذا ما حظي مصطلح ”الجدال“ بالوزن الأعلى» 
حينئذ يكون تركيز الاستفسار على ”التصفية“ بوصفها ”جدالا“. وبعبارة أخرى» 
فإنه يمكن للمستفيد أن يكون أكشر دقة بالنسبة لاستفسار معين عندما يستعمل 
البحث الموزون. وقصارى القولء فإن المعاملين ”و و”فيه| عدا" في البحث 
البوليني» والبحث بمراعاة شكل الحرف الأول من الكلمة؛ والمعامل ”مع“ في 
البحث بالتقارب؛ والبحث بالحقل» والبحث الموزون» ويمكن أن تستعمل كلهاء 
بقدراتها المختلفة» للارتفاع بمستوى التحقيق في مهام الاسترجاع. 


ققنيات الاستر جاع والارتفاع بمستوى الاستدعاء: 


لأيشط المتامل البوليق "أو“.ى] سيق آن نولفا سوى :ووود أي مين 
المصطلحين اللذين يربط بينهماء في الوثيقة المسترجعة. ومن ثم فإن نتائج عملية 
البحث من المفترض أن تزيد في عددهاء ومن ثم في الاستدعاء. فإذا كان الاستفسار 
هو ”التصفية أو الجدال'“ :20560753 018 عسلع:11؛ على سبيل المثال» فإن عملية 
البحث تسفر عن نتائج مناسبة عندما يرد أي من المصطلحين ”'التصفية #سفعها!ة)“ 
أو ””الجدال 02450789“ في النظام. وتبدو القيود على عملية البحث بالمعامل 
”أو“ أقل بالمقارنة بالمعاملين البولينيين الآخرين ”و“ و”فيها عدا“. وكلما قلت القيود 
في عملية البحث ارتفع الاستدعاء. 

ويؤدي البتر إلى توسعة نتائج عملية البحثه بالسماح لزء بعينه من الممصطلح 
. أن يتسخذ أشكالا مختلفة» مادامت النتائج تتقاسم فيا بينها عنصرا واحدا مشتركا 
(وليكن جذع الكلمة على سبيل المثال). وفي هذه الحالة تدخل جميع أشكال جذع 
الكلمة في الحسبان في عملية البحث؛ فمن شأن استفسار للبحث عن * الدوريات 
الإلكترونية“ * له متم زع على مسسبيل المثالء أن يسستر جع وثائق تشتمل عل 
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لقمسوزع. أو كلقسصصاوع أو دسكثلقصعدوزع. أو )كتلقستتد وزع أو أي مصطلح 
آخر يتصدره المقطع [0111:28[©. ومن ثم فإن الاستدعاء بالنسبة لعملية البحث هذه 
يمكن أن يكون ولاشك أعلى ما يمكن أن يكون عليه بالنسبة لعملية بحث لم يتم فيها 
بتر مصطلح الاستفسار. وعندما يتم بتر مصطلح عملية البحث (0101881ز» مثلاً) 
فإن نتائج البحث لن تشتمل إلا على تلك الوثائق التي ورد فيها المصطلح مبجاته الذي 
ورد في الاستفسار على وجه التحديد. 

ويكفل المعامل قريب" 8052412 للبحث بالتقارب» الفرصة لاسترجاع المزيد 
من الوثائق الصاحة؛ بالسماح للمصطلحات التي يربط بينها المعامل لأن ترد بأي 
ترتيب في مرصد بيانات النظام. ومن ثم. فإن عملية بحث تتم بناء على ””المعلومات“ 
قريب من ”التقنيات “ 01083صطءء! 11412 سوه ممأ يمكن أن تسترجع 
الوثائق حول ”تقنيات المعلومات '' 1083م0ضطء»؟ 24102نم205م! أو ' معلومات 
التقنيات'' 0129110ك4د1 '(20108ء16: وبذلك تزيد احتالات ارتفاع الاستدعاء. 
ويعمل المعامل ”'س قريب“ 0152412ه على نحو ماثل لمعامل "قريب" +841/ إلا 
أنه أوسع قدرة على الاستيعاب» وذلك بالسماح بوجود أوجه اختلاف في حدود مدى 
امن الكليات بين المستطلتحين اللدين تيريطظ المعامل ”تن قريب" قا بيتهاء 

ويمكن للبحث المشوشس 0227 أن يؤدي إلى الارتفاع بمستوى الاستدعاء. 
بالكشف عن الأخطاء الناشئة عن الحجاء غير الصحيح» وأخطاء نظام التحقق من 
الأحرف بصرياً 0018,. والمصادر الأخرى للأخطاء؛ وتصويب هذه الأخطاء. فإذا 
كانت هناك وئيقة حول 'الحاتف الخليوي“ 02م «1113اءه. إلا أنه حدث خطأ في 
هجاء المصطلح فأصبح عوطم “عآناااء0). فإنه يمكن للبحث باستعمال أسلوب 
التشويشء أن يظل قادرأ على استرجاع الوثيقة» وبذلك يزداد الاستدعاء بالنسبة 
اقول الع ور 


103 


وتبدف توسعة الاستفسارات إلى استرجاع المزيد من النتائج الصالحة» وذلك 
بتعديل الاستفسارء بناء على الدفعة السابقة من نتائج الببحث. ومن الممكن لعملية 
التعديل هذه أن تتكررء إلى أن يتم الحصول على نتنائج صالحة كافية. والاستدعاء) 
مقياس نسبة الوثائق الصا حة المسترجعة إلى كل ما يتوافر في النظام حول موضوع 
الاستفسار» هو العامل الذي يمكن الارتفاع بمستواه ولا شكء بتوسعة 
الاستفسارات. فمن الممكن» على سبيل المثال» للجولة الأولى من عملية البحث, أن 
تسترجع خمس وثائق فقط صا حة بالنسبة للاستفسار ”أنموذج الفضاء المتجهي“ 
[ع5200 ععهم؟ 1ماء6؟. وبعد النظر في النتائج التي يتم القضول فلريا ماري 
يضاف اسم سالتون (2) ,581608 مثلاً) إلى استفسار جديد للجولة الثانية لعملية 
البحث. فإذا ما تم استرجاع ست وثائق صا حة أخرى نتيجة لذلك» فقد ارتفع 
الاستدعاء على نحو ملحوظ. 

ويكفل البحث في مراصد بيانات متعددة فرصة أخرى للارتقاء بالاستدعاء. 
نظراً للاعتماد على المزيد من مراصد البيانات في عملية البحث. وحينا يتم بحث 
استفسار في عدة مراصد للبيانات» فإن فرصة الحصول على عدد أكبر من النتائج 
الصا حة» تكون أكبر تما يمكن أن يسفر عنه إجراء البحث في نظام استرجاع معلومات 
واحد فقط. وفضلاً عن ذلكء فإنه من الممكن لكل نظام لاسترجاع المعلومات. أن 
يشتمل على كميات معينة وفئات منتقاة فقط من المعلومات. إلا أنه من الممكن 
لمجموعة من نظم استرجاع المعلومات أن تشتمل» ولا شكء على فئات متنوعة من 
المعلومات وبكميات أكبر مما يمكن أن يتوافر في نظام واحد. 

وكما بيناء فإن كلا من معامل أو“ 01 للبحث البوليني» والبثر» ومعامل 
“قريب 210414 للبحث بالتقارب» والبحث المشوشء وتوسعة الاستفسارات؛ 
والبحث في مراصد بيانات متغددة» كل هذه يمكن أن تؤدي إلى توسعة عمليات 
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البحث بطريقة أو بأخرى. وعلى الرغم من أن المزيد من النتائج» لا يمكن بالضرورة 
أن يسفر عن استدعاء مرتفع » فإنه يمكن أن تزيد احتمالات الحصول على المزيد من 
النتائج الصا حة بالنسبة لاستفسار معين. يضاف إلى ذلكء أنه بالإلمام بالطريقة التي 
تؤثر بها كل تقنية من تقنيات الاسترجاع.ء في معياري الاستدعاء والتحقيق بالنسبة 
لهام البحثء» يمكن للمستفيدين اتخاذ قرارات صائبة» في اختيار تقنيات الاسترجاع 
الملائمة لعمليات البحث الخاصة بهم. 


التعببر عن الاستنفسارات: 

ينبغي الإعراب عن الحاجة إلى المعلومات» شفوياً أو تحريرياًء قبل أن يكون 
بالإمكان إجراء عملية البحث اللازمة لتلبية هذه الحاجة. وتسمى الحاجة إلى 
المعلومات التي يتم الإعراب عنهاء بطلب البحث أو طلب الاسترجاع» الذي عادة ما 
يكون باللغة الطبيعية. ومن الممكن حينئذ تحويل طلب البحث إلى استفسارء باستعمال 
إمكانيات نظام استرجاع المعلومات» كقواعد صياغة الاستفسارء وإجراءات 
الاسترجاع. واللغة المقيدة إذا كان النظام يستخدم لغة مقيدة. وتسمى عملية التحويل 
هذه بالتعبير عن الاستفسار أو تمثيل الاستفسارء وهي أكثر العوامل أهمية في 
الاستر جاع (2000 ومعسصمل عاععقمة©). 


الخطوات العامة: 
التعبير عن الاستفسار عملية فكرية» عادة ما تتكون من الخطوات التالية: 


أو الأوجه. 
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.١‏ التفكر في المترادفات»؛ والمصطلحات الأعرض. والمصطلحات الأضيق 
الخاصة بالمفاهيم التي تم التحقق منها. 
. ترجمة هذه المصطلحات إلى اللغة المقيدة» إذا كان النظام يستخدم لغة مقيدة. 
5 استعمال المنطق البوليني للتعبير عن علاقة البدل ”018" بين جمييع 
المصطلحات المترادفة في كل مجموعة من المفاهيم؛ وجمع ”لق“ الأوجه 
المناسبة» ثم استبعاد *501“ أي أوجه غير مرغوب فيها. 
4. استخدام تقنيات استرجاع أخرى حيث) تدعو الحاجة. 
وعلى الرغم من أن هذه الخطوات ليست جامدة أو ملزمة؛ فإنها تشكل جوهر 
التعبير عن الاستفسارات. ومن الممكن أن تكون هناك بعض أوجه الاختلاف في 
الممارسات. وفيا يل مناقشة تحليلية متأنية لعملية التعبير عن الاستفسارات», نظرا لما لما 
من دور حاسم في استرجاع المعلومات. 
تحليل المفاهيم: 
الخطوة الأولى في التعبير عن الاستفسار هي تقسيم طلب البحث إلى مجموعات 
من المفاهيم أو الأوجه؛ فطلب البحثء على سبيل المثال» هو العثور على الوثائق التي 
تعالج تنقية العنكبوتية العالمية بوصفها موضوعاً جدلياً» لابوصفها من تقنيات 
المعلومات. ويتبين بعد التحليل أن هناك ثلاثة مفاهيم واضحة المعالم في طلب البحث» 
كما يتضح في الجدول رقم .١/6‏ 
الجدول رقم ه/ ١‏ تحليل مفاهيم طلب بحث 


المفهوم )١(‏ المفهوم (؟) المفهوم (9) | 
و 
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وقد تصادف في هذه الحالة» أن كانت المصطلحات التي يتضمنها الطلب هي 
نفسها المفاهيم التي ينطوي عليها الموقف. إلا أن هناك مواقف لا يكون فيها تطابق تام 
بين المصطلحات والمفاهيم» فمن الممكن على سبيل المثال» لطلب بحث أن يشتمل على 
مصطلحي ”الحافلات'' 5عقتاط و”مترو الأنفاق“ 5و إلا أن المفهوم 
الأساس يتعلق ” بالنقل العام“ 410هدهمعصقت؛ عذاطدام. وعلى ذلك فإن “النقل 
العام” 3 مهأنذاطتام» وليس الحافلات وعقتاط و”مترو الأنفاق”“ : 
85 ينبغي أن يستعمل لأغراض التعبير هنا. يضاف إلى ذلك أن الأسماء أو 
العبارات الاسمية فقط هي التي ينبغي أن تستعمل للتعبير عن المفاهيم. أما الأفعال» 
إن وجدت في الطلب. فيتم التعبير عنها بالمعاملات البولينية. ولا ينبغي اختيار أجزاء 
الكلام الأخرى للتعبير عن المفاهيم التي أمكن التحقق منها في طلب البحث. 
اختالاف المصطلحات: 

للمصطلحات في غالب الأحيان مترادفات» ومصطلحات أعرض» 
ومصطلحات أضيق» فضلاً عن التنويعات اللأخرى. وهدف هذه الخطوة في التعبير 
عن الاستفسار هو التفكر أو تدبر أكبر عدد من التنويعات» حسب| تقضي اتضرورة» 
بالنسبة للمفاهيم التي سبق التحقق منهاء حتى يمكن التعبير عن المفاهيم على نحو 
شامل. ويوضح الجدول رقم 0/ ؟ التنويعات المحتملة بالنسبة للمفاهيم الثلاثة التي 
تم التحقق منها في الخطوة السابقة. 


57ظ1 


الجدال 









تقنيات الشبكات التنقية 
تقنيات الحاسبيات الرقابة 


تنقية العنكبوتية العالمية 
الرقابة على العنكبوتية 
العالمية 

وكما تبين في الجدول رقم 0/ 7. فإنه لم يتم تسجيل جميع تنويعات المصطلحات 
المحتملة» نظراً لأسباب كالذيوع أو الانتشار أو الألفة» وكذلك الإيجاز. فتحت 
المفهوم )١(‏ على سبيل المثشالء لم نورد "“العنكبوتية العالمية'' مء/78 78106 14ه79 
كشكل مختلف بالنسبة “ للعنكبوتية” داع9. ويتوقف القرار حول ما إذاا كان من 
المتعين تسجيل مصطلح بعينه» على عدة معايير ذاتية ©511[664197» كالاستدعاء 
المتوقع» ومدى التآلف مع الموضوع. وفي الوقت الذي لايتم فيه تضمين جمييع 
الأشكال المختلفة للمصطلح في الاستفسار النهائي» بالنسبة لعملية البحث. فإنه 
يمكن لتسجيل عدد من الاحتّالات؛ أن يساعد في اختيار مصطلحات الاستفسار 
المرشحة. ويمكن لعملية تسجيل الأشكال المختلفة للمصطلحات. أن توفر أيضاً 
مصطلحات مداخل لاختيار المصطلحات المناسبة من اللغة المقيدة» إذا كان النظام 
يستعمل إحدى هذه اللغات. 
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تحويل المصطلحات: 

إذا كانت إحدى اللغات المقيدة تستخدم كلغة لاسترجاع المعلومات» فإن 
المصطلحات التي يتم التعبير عنها بلغة طبيعية في الخطوة السابقة» ينبغي أن تحول تبعاً 
لذلك إلى اللغة التي وقع عليها الاختيار. ومالم يكن الأمر كذلك. فإنه يمكن 
للمستفيد التجاوز عن هذه الخطوة في التعبير عن الاستفسارء والانتقال إلى الخطوة 
التالية. ويشترط التحويل التآلف مع اللغة المقيدة المستخدمة» ى) يمكن أن يسلك أيا 
من الطرق التالية: 

« المقابل الدقيق: أن يكون للمصطلح الواردء مقابل دقيق في اللغة المقيدة. 
ويبدو ذلك أيسر خيار من بين جميع طرق التحويل. 

« المترادفات أو المصطلحات المتصلة: ليس للمصطلح موضوع النظر سوى 
مترادفات أو مصطلحات متصلة فقط في اللغة المقيدة. وينبغي العمل على 
اختيار المصطلح الأقرب في معناه إلى المصطلح الذي يتم تحويله. 

* المصطلحات الأعرض: ليس للمصطلح الوارد سوى مصطلحات أعرض 
منه فقط في اللغة المقيدة. ومن شأن دقة المصطلح الأصلي أن تتاثر سلباً نتيجة 
لهذا التحويل. ٌ 

٠.‏ المصطلحات الأضيق: ليس للمصطلح موضوع النظر سوى مصطلحات 
أضيق منه في اللغة المقيدة. ومن شأن مجال المصطلح الأصلي أن يتقلص من 
جراء هذا التحويل. 

« المصطلحات غير الواردة: أن يكون المصطلح المراد تحويله اسم علم (اسم 
جديداً لا نظير له في اللغة المقيدة. ويتعين في هذه الحالة إيجاد مصطلح جديدء 
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يسمى محدد الهوية أو المعرف 1460111167 لأغراض التحويلء إذا حدث أن 
كان المستفيد اختصاصى معلومات. ومن الممكن إلى حد بعيد في هذه الحالة» 
أن يكون المصطلح الجديد هو نفسه المصطلح المراد تحويله. 
وفيها عدا طريق المقابل الدقيق» تشترط جنيع طرق التحويل الأخرى تفسير 
المصطلحات. وتتحكم دقة التفسير سلفاً في دقة عملية التحويل. 
استخدام المعاملات الولينية: 
إذا افترضنا أن كانت جميع المصطلحات التي جمعت تحت كل مفهوم في الجدول . 
رقم 4/ ؟ في الشكل الصحيح. فإن الخطوة التالية هي استخدام المعاملات البولينية» 
لربط المصطلحات والمفاهيم التي سبق التحقق منهاء وفقاً لما بينها من غلاقات. وعلى 
الرغم من أنه من الممكن أن تكون هناك بعض مظاهر التفاوت في التطبيق» فإن هناك 
قاعدتين عامتين لاستعمال المعاملات البولينية: 
.١‏ ربط المصطلحات في مجموعة المفهوم نفسها (كجميع المصطلحات الواردة في 
عمود ما في الجدول رقم 0/ ؟ مثلاً) بالمعامل ”أو“ 012. 
؟. ربط كل مفهوم في طلب البحث (أي في الصف في الجدول رقم 0/ ؟) 
بالمعامل ”و“ لاله أو المعامل ”فيا عدا“ 8101 تبعاً للحاجة. 
ويوضح الشكل رقم 5/ ؟ هذه العملية رمزياء بمجموعات المفاهيم التي 
وردت في الجدول رقم 5/ ؟ بالنسبة لمثال طلب البحث. 
ويبدو أن هناك نقطتين بحاجة إلى توضيح بشأن الشكل رقم 5/ 7؛ أولاهماء 
كم عدد المصطلحات من كل مجموعة من مجموعات المفاهيم» يمكن أن يتبضمنها 
الاستفسار؟ وبعبارة أخرى كم مصطلحاً ينبغي الربط بينها معاً بالمعامل أو 012؛ 
للتعبير عن كل مفهوم أمكن التحقق منه؟ وتتوقف الإجابة ني الأساسء على عدد 
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النتائج التي يتوقع المستفيد الحصول عليها. وكلم| زاد عدد المصطلحات المرتبطة معاً 
بالمعامل ”أو“ +01 ازداد عدد النتائج التي يتلقاها المرء. وعلى النحو نفسه. فإنه كلم) 
قل عدد المصطلحات المرتبطة معاً بالمعامل ””أو“ 018 انخفض عدد التدائج التي 
يمكن أن يحصل عليها المرء. والأسلوب المألوف المتبع في اتخاذ مثل هذا القرار» هو 
وضع جميع المصطلحات الواردة مرتبة وفق أولويات» ثم اختيار المصطلحات القليلة 
الأولى الواردة في القائمة» لكي يتم ربطها معاً بالمعامل ””أو'“ 012 تبعاً الحاجة المرء. ولا 
نحدد في الشكل رقم 0/ ؟ كم مصطلحاً يمكن أن تستعمل للتعبير عن المفهوم 
المقابل. وكل ما هنالك أنه يفضل أن نبين أن هناك مصطلحات أخرى متاحة للمعامل 
”أو“ +01. 


والنقطة الثانية في الشكل رقم 7/5 التي تحتاج إلى توضيح» هي استعمال 
الأقواس؛ ففي مناقشتنا للبحث البوليني» في القسم 0/ 2١/١/1١‏ عرضنا ترد 
التجهيز بالنسبة لعمليات البحث البوليني المركبة. والمثال الموضح في الشكل رقم 
١ 5‏ عملية بحث بوليني مركبة» تتطلب استعمال الأقواس لتغيير القرتيب الطبيعي 
للتجهيز. وما لم تستعمل الأقواس فإنه يمكن لنتائج عملية البحث أن تكون أي شيء؛ 
إلا ما كان المستفيد يقصد من وراء عملية البحث. وإذا افترضنا أننا استبعدنا جميع 
الأقواس في الشكل رقم 27/0 واحتفظنا بجميع المصطلحات المقترحة في ذلك 
الشكلء وبالترتيب نفسه أيضاًء فإنه يمكن للمصطاح الأول الوارد تحت المفهوم ” 
(أي تقنيات المعلومات) أن يتم استبعاده من مجموعة النتائج التي تنشأ في) يتعلق 
بالمصطلح الأخير الوارد تحت المفهوم ؟ (أي ““النزاع'' عانامولك). كذلك يمكن أن 
تنشأ نتائج أخرىء غير متوقعة في النهاية. ومن ثم فإنه ينبغي استخدام الأقواس إذا 


كان للترتيب الطبيعي للتجهيز أن يتغير. 
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وتفسر أهمية الأسلوب البوليني في استرجاع المعلومات نفسها بنفسها؛ إذ يتعين 
استخدام المنطق البوليني في التعبير عن الاستفسار مالم تكن عملية البحث تشتمل 
على مصطلح واحد فقط. إلا أن تطبيق عملية البحث البوليني أكثر تعقدأ بالفعل مما 
تبدو. وللمزيد من مناقشة تعقد البحث البوليني ومشكلاته» راجع الفصل السابع 
٠‏ “ناذج استرجاع المعلومات . 


المفهوم " المفهوم " المفهوم ١‏ 
تقنيات المعلومات ١‏ ظ الجدال تنقية العنكبوتية 
فيما عذا :7 


أو أو 
المصطلحات الأحرى المصطلحات الأخرى 


أو 
المصطلحات الأحرى 





الشكل رقم 7/0 تطبيق المعاملات البولينية 
استعمال تقنيات الاسترجاع الأخرى: 
هناك الكثير من التقنيات الأخرى التى يمكن للمستفيد اتباعها للتعبير عن 
الاستفسار بدقة ووضوح؛ فبالنسبة لعملية بحث “تنقية العنكبوتية #صفرء؛111 مء837 
على سبيل المثال (انظر الجدول رقم 0/ ؟) يمكن للمستفيد النظر في: 
« ما إذا كان البحث بمراعاة شكل الحرف الأول متاحاً للتمييزء حيث تدل 
ع7 على العنكبوتية العالمية 577 157106 791]0710, وتعني 7961 نسيج العذكبوت 
طاع8 *مع10م5. 
« ما إذا كان من الممكن بتر المصطلح ع84ا0. 
* ما إذا كان من الممكن استعمال معاملات التقارب مثل “مع 791111 أو 
”قريب“ 211418 للتعبير عن “تقنيات المعلومات*' 2102صمتمكمة 
'قع27010طاع16. 
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« ما إذا كان من الممكن لعملية البحث أن تقتصر على حقول معينة؛ كحقل 
العنوان أو حقل الواصفات. 
» ما إذا كان نظام استرجاع المعلومات الذي وقع عليه الاختيار يدعم البحث المشوش. 
* ما إذا كان من الممكن تحديد أوزان لأي من المصطلحات التي وقع عليها الاختيار. 
« ما إذا كان التلقيم المرتد الخاص بالصلاحية يحظى بدعم النظام, أو ماإذا 
كانت توسعة الاستفسار يمكن أن تتم يدوياً. 
© ما إذا كان من الممكن البحث في مراصد بيانات متعددة. 
وكما سبق أن بيناء فإن قليلاً من نظم استرجاع المعلومات» تكفل جميع إمكانيات 
البحث التي ناقشناها حتى الآن. ومن ثم فإن قائمة تقنيات الاسترجاع هذه إن| هي بمثابة 
قائمة مراجعة» وليست قائمة '”ملزمة“. وفي هذه المرحلة يمكن للاستفسار أن يكون قد 
تم التعبير عنه كاملا وأصبح جاهزاً لأن يقدم لإجراء عملية البحث. 
والتعبير عن الاستفسار. بوصفه تعبيراً عن مواصفات المعلومات» عملية 
معقدة إلى حد بعيد. وعلى الرغم من أننا قد لخصنا هذه الخطوات الخمس.ء لتوضيح 
النقاط الجوهرية في التعبير عن الاستفسارء فإن التطبيق الفعلى قد لا يتكون من العدد 
نفسه من الحنطوات. أو لا يتبع الترتيب نفسه. فالمستفيدون المتمرسونء على مسبيل 
المثال» يميلون للجمع بين بعض الخطوات معاًء بينم| يمكن للمستفيدين المبتدثين أن 
يكونوا عزوفين عن اتباع أي مسارات مختصرة. 
وخلاصة القولء فإن الخطوة ١‏ في التعبير عن الاستفسارات» تتعلق بتحليل 
88 طلبات البحث إلى مفاهيم» وتبتم الخطوتان " و" بتر حمة المفاهيم 
إلى مصطلحات الاستفسار. أما الخطوتان 6 وه فتركزان على تطبيق مختلف 
أساليب الاسترجاع. 


203 


يختلفء فإن التعبير عن الاستفسار ينبغي أن يبرز هذه الظاهرة» بوضع تفرد العملية أو 
اخختلافها في الحسبان. 
مشكلات التعبير عن الاستفسارات: 

التعبير عن الاستفسارات». كا ناقشناه» ليس عملية ميكانيكية» وإنما عملية 
فكرية» تتطلب إعمال العقل والاجتهاد. يضاف إلى ذلك أن هذه العملية الفكرية 
تنطوى على عدة مشكللات. ْ 5 

ويعد تحليل المفاهيم أولى المشكلات في التعبير عن الاستفسارات؛ إذ ينبغي أن 
تتوافر للمستفيد المعرفة الكافية» والخبرة» والمهارات لكي يتجقق من المفاهيم التي . 
يتضمنها طلب البحثء والتعبير عن هذه المفاهيم. ومن الممكن للذاتية أن تتسلل 
بسهولة إلى العملية. والتحليل غير الدقيق ليسن بالظاهرة غير المألوفة. 

واللغة هى المشكلة الثانية في التعبير عن الاستفسارات؛ فاللغة الطبيعية ثرية» 
مرنة» غامضة؛ ومبهمة في بعض الأحيان. بين) اللغة المقيدة جامدة»؛ ومصطنعة» ومن 
الصعب المحافظة على تجددها. إلا أن طلب البحث ينبغى التعبير عنه بأقصى درجات 
الدقة بكل من اللغتين. ويمكن لهذا التحويل أن يؤدي إلى بعض مظاهر التفاوت في 
عملية التعبير» ويؤثر في أداء الاسترجاع في النهاية. ويضاعف استعمال اللغة المقيدة 
من صعوبة التعبير عن الاستفسارات» نظراً لأن تآلف المستفيد مع هذه اللغة يتطلب 
وقتاًوجهداً. وفي مقابل ذلك فإن لاستعمال اللغة الطبيعية في التعبير عن 
الاستفسارات سلبياته ى| بينا في الفصل الرابع. 

ويثير استخدام تقنيات الاسترجاع المناسبة مشكلة أخرى في التعبير عن 
الاستفسارات؛ فكل نظام لاسترجاع المعلومات يحدد معالم مواصفاته وطريقة 
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استعماله فيم| يتعلق بأساليب الاسترجاع (فعلامة زائد + على سبيل المثال» تعني في 
بعض نظم استرجاع الإنترنت المعامل البوليني "و طلالش بين] تستخدم في نظم 
أخرى رمزاً للوزن). كذلك يستنفد التمكن من استعمال هذه الأساليب وقتأء كما 
يتطلب المارسة. 

ومن الممكن لكل هذه المشكلات أن تؤدي إلى افتقار التعبير عن طلبات 
البحث إلى الدقة» الأمر الذي يفضى في النهاية إلى أخطاء المضاهاة بين التعبير عن 
الاستفسار والتعبير ادو ميات المعلومات. وللتغلب على هذه المشكلات يمكن 
تثقيف المستفيد» وتدريبه من ناحية» والسعي وراء اختراقات أو تطورات جوهرية في 
البحث العلمي حول التعبير الآلي عن اللسق راك 


الأسلوب الالبى: 

هناك رغبة ملحة في التعبير عن الاستفسارات آلياًء إذا ما كان بالإمكان فعلاً 
تحقيق ذلك. فالأسلوب الآلي؛ شأنه شأن التكشيف الآلي والطرق الآلية الأخرى 
لمعالحة النصوصء يتوقف إلى حد بعيد على خصائص من قبيل تردد الكلمات 
المفتاحية» والتقارب. والموقع. كذلك تطبق الخوارزميات القائمة على الاحتمالات» 
واللغويات الحاسبية» والذكاء الاصطناعي أيضاً في بعض الأحيان. إلا أنه على عتكس 
التكشيف الآلي» الذي ينطوي على أنشطة ميكانيكية وفكرية في الوقت نفسه. فإن 
التعبير عن الاستفسارات آلياً لا يتتضمن سوى مكون فكري فقط. ولما كانت 
الحاسبات لا تزال غير قادرة على التفكير كالإنسان» فإنه ليس من الصعب تصور 
المشكلات التي يمكن أن تثارء إذا ما ألقي على الحاسبات عبء المهمة الفكرية الخاصة 
االتعبير عن الاستفسارات. 

وقد اختبر الباحثون في استرجاع المعلومات التعبير عن الاستفسارات آلياًء في 
الماضي. كذلك حظي الأسلوب الآلي باهتام مكثف في مشروع مؤقرات استرجاع 
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النصوص ”ترك“ 110150. وقد تبين» على سبيل المثال» أن الاستفسارات التي تصاغ 
آلياء من ال موضوعات 100165 كانت تعمل كا تعمل الاستفسارات التي تصاغ يدويا 
إن ل يكن أفضلء في المرحلة الأولى من مشروع ترك ١‏ 1 :118886. ولم يكن هناك هيز 
أو تحسن واضح نتيجة لإعداد الاستفسارات يدويأ (1995 ,وعه0[ علءمةم5). وفي 
المرحلة الرابعة» ترك 5 4 :11186؛ كان هناك قليل من النتائج الآلية القابلة للمقارنة 
بالتتائج اليدوية» أو تضارعهاء بالنسبة للاستفسارات القصيرة. إلا أن الاتجاه في ترك 
0 وترك ١‏ يرجح الصياغة اليدوية للاستفسارات» التي تتم عادة للاستفسارات 
الطويلة:؛ إلى حد يفوق أداء الصياغة الآلية للاستفسارات بوضوح. بالنتبة 
للاستفسارات الطويلة نفسها (2000 ,70865 علءتدقم58). ويشتمل الفصل الحادي 
عشر على المزيد من المناقشات حول سلسلة ترك 110150. 

وعلى الرغم من أن نتائج سلسلة ترك 1718180 ليست خبائية أو حاسمة. فإنها 
تظهر قصور الأسلوب الآلي» على ضوء الوضع الراهن للبحوث في هذا المجال. 
وهناك حاجة إلى المزيد من الجهد للارتفاع بمستوى الطريقة الآلية للتعبير عن 
الاستفسارات. 
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الفصل السادس 
طسرق الاستسرجساع 


من الممكن تحقيق استرجاع المعلومات بالبحث أو التنقيب عوستدكءقءى 
أو بالتصفح 8هأ5079, أو بالطريقتين معا. ويتوقف اختيار طريقة الاسترجاع المناسبة 
على طبيعة حاجة المستفيد إلى المعلومات؛ وذلك من بين عوامل أخرئ. ونحاول في هذا 
الفصل استكشاف الطرق الثلاث المختلفة للاسترجاع؛ إلى جانب خصائص هذه 
الطرق وتطبيقاتها. 
وقد صاغ كل (2000) 1811 التناظر الوظيفي التالي» عند مناقشة استرجاع 
المعلومات. فقد ذهب إلى أن العثور على إبرة (أي وثيقة أو معلومات) في كومة تبن 
عاءهائزقط (أي نظام استرجاع المعلومات أو مرصد البيانات ©0808585) يمكن 
أن يعني: 
5 إبرة معروفة في كومة تبن معروفة. 
". إبرة معروفة في كومة تبن غير معروفة. 
". إبرة غير معروفة في كومة تبن غير معروفة. 
5. أي إبرة في كومة ما. 
0 أمضى 54»م5927 إبرة في كومة التبن. 
5. معظم أمضى الإبر في كومة التبن. 
. جميع.الإبر في كومة التبن. 
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8. تأكيد غياب الإبر في كومة التبن. 

4. أشياء تشبه الإبر في كومة التبن . 

٠‏ . دعني أعرف متى تظهر إبرة جديدة. 

.١‏ أين أكوام التبن. 

الإبر أو أكوام التبن - أياً كان. 

وقد أمكن في القائمة السابقة حصر الاحتمالات المختلفة بشأن الإبرة وكومة 
التبن» إلا أن هذا الحصر لم يحقق الشمول. ومما لا شك فيه؛ أن البحث أو التنقيب هو 
الطريقة المناسبة لحالات معينة (رقم ١‏ على سبيل المشال)؛ ويبدو التصفح ملائً 
لحالات أخرى (رقم ١7‏ على سبيل المثال). ويمكن لبعض ال حالات في القائمة (رقم ه 
على سبيل المثال) أن تتطلب الاستخدام المشترك لطريقتي الاسترجاع. 


الاسترجاع بالبحث: 

البحث أو التنقيب 8لالط©568 طريقة للاسترجاعء تستخدم منذ زمن طويل. 
وهو أيضاً موضوع دائا ما يحظى بالمعالجة في استرجاع المعلومات» حيث يمكن أن 
يسمى البحث في مراصد البيانات» والبحث على الخط المباشرء والبحث في العنكبوتية 
العالمية» أو ما شابه ذلك. وبمجرد أن يتم التعبير عن الاستفسارء يكون المستفيد 
مستعداً لإجراء عملية البحث؛ من أجل استرجاع المعلومات من النظام. 

يقصد بالبحث بادئ ذي بدء العثور على ما يمكن أن يضاهي المصطلحات 
المحددة الواردة في الاستفسارء باتباع مختلف تقنيات الاسترجاع التي تناولناها في 
الفصل الخامس. ومن الممكن إجراء البحث عن طريق أي من نقاط الوصول 826655 
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5أطأمم الموضوعية أو غير الموضوعية. وعادة ما تشمل نقاط الوصول الموضوعية» 
2 نظم استرجاع المعلوماتء. الواصفات همدع أو المعرفات أو محددات 
الموية 106514141615 أو وسيرات أو رموز التصنيف. أو رؤوس الموضوعات. أو 
المراجع المستشهد بهاء في البحث بالاستشهاد المرجعيء والمصطلحات الواردة في 
العناوين» والمستخلصات. أو النص نفسه. في البحث في النصوص الكاملة 
(1997 ,11381880). وتشمل نقاط الوصول غيز الموضوعية المألوفة» اللغة» وسنة 
النشرء ونوع الوثيقة» وما شابه ذلك. 

ويمكن للبحث أن يكون طريقة استرجاع فعالة» عندما يكون الاستفسار 
محدداء والمستفيد على دراية على وجه اليقين با هو بصدد البحث عنه. فإذا كان 
المستفيد يود على سبيل المثال» العثور على كل بحوث سالتون 521402. التي نشرت 
في تسعينيات القرن العشرين. فإنه يمكن للبحث بحقل المؤلف وحقل عام النشرء أن 
يسفر عن النتائج المتوقعة". أما إذا كان المستفيد يود التعرف على سبيل المثال» على كل 
أولئك الذين سجلوا إسهامات في مجال استرجاع المعلومات» فإن البحث وحده لا 
يمكن أن يلبي هذه الحاجة. 

وفي طريقة البحث,. يمكن لتقنيات البحث كالمنطق البوليني» أن تكفل 
للمستفيد الجمع بين مختلف الأوجه في استفسار البحث,. حي تدعو الحاجة. 
وباستثناء بعض نظم استرجاع الإنترنت» فإن معظم نظم استرجاع المعلومات تدعم 
إدخال المزيد من التعديل في استفسارات البحثء بمساعدة تقنيات الاسترجاع 
الملائمة (كالبحث بالحقل على سبيل المثال). وبإمكان النظام إنجاز كل هذه المهام. 
بمجرد أن تقدم له كعناصر في الاستفسارات. وهذه العملية مباشرة صريحة» ولا تلقي 
بعبء معرفي ثقيل على كاهل المستفيد. 


() وذلك بالربط بين الوجهين بالمعامل البوليني و“ 41/0 بالطبع. (المترجم) 
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غير أن البحث نشاط منضبط؛ وقل| تكون هناك فرصة للصدفة (أي اكتشاف 
شيء له قيمته فعلاً ولكنه لم يكن متوقعاً أثناء إجراء البحث)» ذلك لأن النظام لا يقدم 
سوى تلك النتائج التي تضاهي الاستفسار. يضاف إلى ذلك أن مهارات البحث لا 
تتحقق طبيغياً أو بالفطرة؛ إذ يتعين على المستفيد أن يتعلم كيف يبحثء وعليه أن 
يتمرس حتى يتمكن من إجراءات البحث. ويمكن لتكلفة التعلم والتمرس أن تكون 
عالية» إذا كان التعامل مع نظام استرجاع المعلومات يتم مقابل رسوم. 
أنواع عمليات البجحث: 

من الممكن تقسيم عمليات البحث إلى أنواع مختلفة تبعاً لأغراض البحث؛ 
فعندما يكون لدى المستفيد وثيقة معينة في ذهنه» فإن البحث يسمى البحث عن وثيقة 
أو عن مادة. وعادة ما يتم إجراء البحث عن مادة معروفة بوجه عام؛ بناء على خواص 
وثيقة معروفة» كاسم المؤلف والعنوان. والمناظر الوثيق للبحث عن وثيقة معروفة هو 
ما ذهب إليه كل (2000) 16011 ”إبرة معروفة في كومة تبن معروفة' . 

وعندما يختار المرء موضوعات للبحث. فإنه يجري بحثا في الإنتاج الفكري 
لاكتشاف ما إذا كان هناك باحثون آخرون أنجزوا أي عمل في هذا المجال. ولا يفاجأ 
الباحثون إذا لم يعثروا على أي شيء وثيق الصلة باستفساراتهم» عند إجراء عمليات 
البحثء بل إنهم قد يسعدوا عندما يعرفوا أن لا شيء قد نشر بعد في الموضوع. 
ويسمى هذا الضرب من عمليات البحث بالبحث السلبي ر0ططض!' عه 501610) 
(1998. أو كما عبر عنه كل (2000) 1011 بأنه '”التأكد من أن لا إبر في كومة التبن“. 
وينبغي للبحث السلبي أن يكون شاملاً وضافياًء حتى يكون المستفيد النهائي واثقا من 
أنه ليست هناك و ثائق تتضل باهتامه أو يمكن أن تلبي حاجته"». ْ 


(:) يلجأ المستفيد للبحث في الإنتاج الفكري عندما تتجاوز حاجته مجرد التحقق من وثيقة معينة. 
وللبحث في الإنتاج الفكري مساران؛ مسار راجع للتحقق من رصيد الإنتاج الفكري في مجال 
معين, في حدود لغوية وجغرافية وزمنية معينة» ومسار جار لمتابعة ما يستجد من وثائق في 
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ولمواكبة مجريات جبهة البحثء أو لأسباب أخرى مناظرة» يحرصٍ المرء على 
اكتشاف ما هو جديد في مجاله» وذلك بالبحث في الإنتاج الفكري. ويسمى هذا 
الضرب من البحث بالبث الانتقائي للمعلومات (بام 581). وكما بينا في الفصل 
الأولء فقد صمم لون (1961) هطنائة طريقة البث الانتقائي للمعلومات» التي 
استتخدمت على نطاق واسعء وخصوصاً في الأوساط المالية والعلمية. وبالنسبة 
لعمليات البحث لأغراض البث الانتقائي للمعلومات» يظل الاستفسار ى) هوء إلا 
أنه يقدم لنظام استرجاع المعلومات دورياً. كذلك يمكن أيضاً تجهيز عمليات البحث 
للبث الانتقائي للمعلومات آلياً. وقد صور كل (2000) 15011 عمليات البحث للبث 
الانتقائي للمعلومات بوصفها ”دعني أعرف كلما ظهرت إبرة جديدة “. 

ويدل البحث الموضوعي على ضرب آخر من عمليات البحث؛ فالمستفيد 
النهائي يشعر بالحاجة إلى المعلومات» ويود البحث عن بعض النتائج الصاحة. 
ولصياغة استفسار البحثء ينبغي استخدام نقاط الوصول الموضوعية التي أشرنا إليها 
في القسم »١/١/5‏ وتلحق بها الخصائص غير الموضوعية (كاللغة وسنة النشر على 
سبيل المثال). وينبغي وضع تقنيات استرجاع مختلفة في الحسبان للحكم على معدل 
استدعاء وتحقيق عملية البحث. وقد عرض كل (2000) 15011 عدة أمثلة للبحث 
الموضوعيء من منظور الاستدعاء والتحقيق عندما صاغ التناظرات التالية: 


() يقوم البحث للبث الانتقائي للمعلومات على ثلائة ركائزء وهي مرصد البيانات» وسهات 
المستفيد ©70151م 3565ا ومضاهاة سمات المستفيد بأحدث قطاع في مرصهد البيانات. وجدير 
بالذكر أن البث الانتقائي للمعلومات قد تطور عن الإحاطة الجارية 2121762655 ]عللا©. 
راجع في ذلك: 
حشمت قاسم: خدمات المعلومات» مقوماتها وأشكاها. القاهرة» دار غريب» 19454 . 
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» أي إبرة في كومة التبن: البحث منخفض الاستدعاء ولكنه مرتفع التحقيق. 
٠‏ أمضى إبرة في كومة التبن: البحث مرتفع التحقيق. 
٠‏ معظم أمضى الإبر في كومة التبن: البحث مرتفع الاستدعاء. 
» جميع الإبر في كومة التبن: البحث في ذروة الاستدعاء. 
وهناك إمكانات أخرى (عمليات بحث منخفضة التحقيق ولكنها مرتفعة 
والتحقيق. وبالمقارنة بأنواع عمليات البحث الأخرىء» يبدو البحث الموضوعي أكثرٌ 
الأنواع تعقداًء وذلك لأن النتائج التي يتم الحصول عليها من البحث. ينبغي تقييمها 
باستخدام المعيارين الجدليين» الاستدعاء والتحقيق. وى! سبق أن ذكرنا فإن الجدل 
حول التحقيق والاستدعاء كمقياسين لأداء الاسترجاع. سوف نتناوله بشّىء من 
التركيز في الفصل الحادي عشر “تقييم تنظيم المعلومات واسترجاعها'". 
ويمثل بحث الفقرات 8سلطع56»2 ع5528وم» الذي ورد بإيجاز في القسم 
١١‏ بوصفه استرجاع الفقرات» ضرباً آخر من عمليات البحث؛ إذ لا يتلقى 
المستفيد سوى الفقرة المناسبة فقط من الوثيقة» لا الوثيقة كاملة. ويتم الاعتماد بكثافة 
على مهمة التنقية في بحث الفقرات. وعلى الرغم من أنه لم يظهر إلا في السنوات 
الأخيرة» فإن بحث الفقرات ينطوي على احتّالات ضخمة بالنسبة لمساعدة المستفيد 
في الحد من عباء المعلومات الزائد. والارتفاع بمستوى التحقيق في الاسترجاع. 
ويتناول هذا القسم خمسة أنواع مختلفة لعمليات البحث؛ وهي البحث عن 
مواد معروفة» والبحث السلبىء والبث الانتقائى للمعلومات» والبحث الموضوعى» 
وبحث الفقرات. وباتباع معيار آخر للتقسيم الفئوي» صنف بايزا - ييتس وريبرو - 
نتو (1999) مغعلل-مرلعط183 0ه 5ع1ولا-83222 عمليات اليحث إلى نوعين» 
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البحث المخصص أو الموجه 106 20 والتنقية 51161488. وأيا كانت تسمية نوع عملية 
الى » فإن الهدف هو تحديد أي أساليب البحث» وأي استراتيجيات البحث ينبغي 


اتباعها لتلبية احتياجات المستفيد. 
استراتيحيات البحث: 


استزاتبجيات الث هى الشبل 'العدى يسكلها لتر عمد إجراءغمليات 
البحث. وفي العصر الذهبي للبحث على الخط المباشر» تحددت معالم الأنواع الأربعة * 
التالية من استراتيجيات البحث» كما تم توضيحها (1981 رسدعه]1] يت اعطعتصء1). 


طريقة كتل البناء: 

تبدأ طريقة كتل البناء 10616 10158ثناط بعمليات البحث أحادية المفهوم 
أمءعصمع-ءلوصله. والمفاهيم الأحادية كتنقية العنكبوتية والجدال'' عستء)21 عم 
'ا5ا084076© سق الواردة في الجدول رقم 2١/5‏ هي تلك التي أمكن التحقق منها 
في تحليل المفاهيم. وبعد أن تكتمل جميع عمليات بحث المفاهيم الأحادية» يتم الجمع 
بين المجموعات الناتجة معاً باستعيال المعاملات البولينية الملائمة. 

ويمكن لهذه الاستراتيجية أن تحلل مهمة البحث المركب. إلى مهام أبسط. كما 
أنها تكفل أيضاً للمستفيد إجراء التصويبات أو إدخال التعديلات». كلما دعت الحاجة» 
فق لجنو قووك أثاء إجراه عمادات العف لنيين عل متايه أن يبد [متراء 
البحث كاملاً» نظراً لحدوث خطأ مطبعي بسيط أثناء إدخال صيغة البحث. ومن ثم 
فإن نبج كتل البناء يخفض الضغط على المستفيد الذي يمكنه حينئذ التركيز أكثر على 
التفاعل مع النظام. ولهذه الأسباب يوصى ببذه الاستراتيجية بقوة لدى المستفيدين» 
وخصوصاً المبتدئين منهم. 
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طريقة الكرة الحليدية: 

وتعنى طريقة الكرة الجليدية 580785811188: التى تعرف أيضاً بطريقة زراعة 
اللؤلق بالاتنابى 8 - 72271 لوتاهان0) (1981 رصدع10] ع اعطعتمء"1). 
أن نتائج البحث تزداد ىأء على نحو يشبه كثيراً ناتج دحرجة الكرة الجليدية في الثلج. 
وتما لا شك فيه» أن هذه الطريقة #بدف إلى الارتفاع بمستوى الاستدعاء. فباتباع هذه 
الاستراتيجية خري المستفيد أولاً عملية البحث؛ ثم يغدل امنتفسار الببحث بناء عن 
النتائج المسترجعة.:وتنطوي عملية التعديل على النظر في النتائج؛ واختيار 
المصطلحات الصالحة (ككلمات العنوان والمواصفات مثلاً) ثم تضمينها في النص . 
المنقح للاستفسار. ومن الممكن تكرار هذه العملية إلى أن يصبح المستفيد راضياً عن 
نتائج البحث تّاما. 

فإذا ما استرجع بحث عن ”الكتاب الإلكتروني” عاووط عتصمت6ءء1ء على 
سبيل المثال» وثائق تشتمل على مصطلحات مثل ستيفن كنج والكتاب الإلكتروني 
2001© 2ق قصتك1 معطمع)5: فإنه يمكن للمستفيد أن يتبع طريقة كرة الجليد. 
بتضمين هذين المصطلحين في صيغة البحث المنقحة» من أجل توسعة نتائج البحث. 
ونحن نعلم أن ستيفن كنج هو أول مؤلف شهير ينشر إلكترونيا*» وأن 001» شكل 
مختصر من 50016 ©6164081. وطريقة كرة الجليد في جوهرهاء تماثلة لأسلوب 
الاسترجاع المتطور. وهو توسعة الاستفسارات» الذي تناولناه في القسم 1/1/1 
وقد أطلق كورفاج (1997) 1040886 على هذه الطريقة اسم تجهيز الاقتباس 
28 «ووتاهاك. وكا تبين فعلاء فإن طريقة الكرة الجليدية هذه مفيدة على 
وجه الخصوصء عندما تكون لدى المستفيد الرغبة في التحقق من المصطلحات 
المتصلة» من أجل توسعة عملية البحث. 


(:) مؤلف روائي أمريكي, ألف خسين رواية» فضلاً عن ثماني مجموعات قصصية؛ ويلغ إجمالى توزيع 
كتبه أكثر من 70٠‏ مليون نسخة. وتحول بعضها إلى أفلام سينائية ومسلسلات تلفزيونية. (المترجم) 
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طريقة التحزىء المتتابع: 

تبدو طريقة التجزىء المتتابع 0 5116065519 عكس طريقة الكرة 
الجليدية؛ فعندما يبدأ البحث بمفهوم عريضء تتكفل طريقة البحث بالتجزىء المتتابع 
بتضييق البحث باستخدام مختلف أساليب التقييد أو التحديد. ويستخدم أحد أنواع 
التحديد المعاملات البولينية ومعامل التقارب» عند صياغة عبارة البحث. وكما سبق 
أن بيناء فإن معامل 'فيم| عدا“ 2107 يضيق البحث باستبعاد مصطلحات معينة. 
ويحقق المعامل و4110 الهدف نفسه بإضافة المزيد من الشروط في البحث. كذلك 
يضيق المعامل “مع 3 البحث بتحديد مواضع الكلمات في استفسار البحث. 
ومن الممكن تحقيق ضرب آخر من التضييق باستعمال خواص غير موضوعية كاللغة» 
ونوع الوثيقة» وسنة النشر. ويبدو التضييق بمثل هذه الخواص غير الموضوعية أبسط 
وأيسر من التضييق بالمعاملات. 

لنفترض أنه قدتم إجراء بحث عن "التنقية'' 4146128 وكانت النتائج 
تشمل كل شيء حول التنقية» حظى بالتغطية في نظام استرجاع المعلومات. فإذا كان 
هدفنا هو البحث عن معلومات حول.تئقية العنكبوتية العالمية بوصفها جدال» وليس 
بوصفها من تقنيات المعلوماتء فإننا يمكن أن نتبع طريقة التجزىء المتتابع لتحقيق 
هدفنا؛ إذ يمكن على سبيل المثال» إضافة المصطلح ””العنكبوتية العالمية“ ©" أولآ 
إلى صيغة البحث باستعمال المعامل “و” 3/2ه. ومن الممكن إضافة مصطلح 
الجدال” إ0865075© بالطريقة نفسها. ومن الممكن بعد ذلك استخدام معامل 
“في) عدا“ 23801 وذلك لاستتبعاد أي نتائج تشتمل على مصطلح “تقنيات 
المعلومات '“ نإعهامصطءع؟ ده دتم:م/صة. ومن الممكن تحقيق المزيد من التضييق» 
بقصر البحث على الوثائق التي نشرت قبل عام ١447‏ على سبيل المثال. 
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وكما بيناء فإن طريقة التجزىء المتتابع تفوق العف تف عدا باستعزال أساليت: 
التحديد المتاحة في نظام استرجاع المعلومات. وتشترط استراتيجية البحث هذه أن 
يكون المستفيد متآلفاً مع مقومات التحديد المتوافرة في النظام» وأن يحافظ على تفاعله 
مع النظام أثناء البحث. وإذا ما وقع الاختيار على استراتيجية التجزىء المتتابع» فإنه 
يمكن للتكلفة أن تكون مهمة: بالنسبة للمستفيد من نظم استرجاع المعلومات على 
الخط المباشر (را- جع القسم // )١‏ نظراً لأن هذه الاستراتيجية تنطلب وقت تجهيز 
أطول ما تتطلبه استراتيجيات البحث الأخرى. والواة قع أن نظم استرجاع الإنترنت 
(راجع القسم 8/ 4) لا تفرض رسوماً على المستفيد, إلا أن مقومات التضبيق التي 
توفرها مثل هذه النظم» لا تزال غير ملائمة إلى حد بعيد. 
الأولوية لأكثر الأوجه تحديدا: 

تطبق طريقة الأولوية لأكثر الأوجه تحديداً أ5؟ أء©12 عتلاععم5 أوممم على 
عمليات البحث متعددة الأوجه أو المفاهيم (1981 رصدعه]1 © [اعطعتصه؟). 
وتفترض هذه الطريقة أن يكون المستفيد على دراية بجميع الأوجه. أو مجموعات 
المفاهيم التي تتضمنها عملية البحثء ىا أن باستطاعته أيضاً التحقق من أكثر المفاهيم 
تحديداً. ويمكن لاستراتيجية البحث هذه أن تكون عالية الكفاءة؛ نظراً لأنما تبدأ 
عملية البحث بمصطلح يمكن أن يستغرق البحث عنه أقل قدر من الوقت. وفضلاً 
عن ذلك لا يكون هنأك مبرر لمواصلة البحثء إذا كان عدد النتائج المسترجعة بالنسبة 
لأكثر الأوجه تحديداء لا يمكن قبوله؛ فهناك على سبيل المشال ثلاثة أوجه في عبارة 
”“علاج الأورام الهرمونية العصبية في الرئة والتنبؤ با“ قصة ؛صعصندعم 
28نا[ 11 111 322015 عملعء106200ن1ع2 01 20515ع08"اآص وهي "العلاج 
والتنبق“» و”الأورام الحرمونية العصبية“» و”الرئة “. ومن بين هذه الأوجه الثلاثة 
تبدو ”الأورام ال هرمونية العصبية“ هي الوجه الأكثر تحديداء وبذلك يتم البحث عنه 
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أولاً في هذه الطريقة. وإذا ما استرجع البحث عن ”الأورام الهرمونية العصبية“ 
وثيقتين فقطء فإنه لا يحتمل للبجث الذي يشمل الأوجه الثلاثة أن يسفر عن نتائج 
أكثر من الوثيقتين اللتين أمكن العثور عليهما فعلاً. 

وفضلاً عن كفاءتهاء يبدو تطبيق هذه الطريقة متطوراً جداً. فلما كان تحليل 
المفاهيم وحده مهمة شاقة» فإنه يصبح من المستحيل تقريباًء بالنسبة لمستفيد مبتدئ 
التحقق من أكثر الأوجه تحديداً» في طلب للبحث متعدد الأوجه. ومن ثم فإن طريقة 
الأولوية لأكثر الأوجه تحديداً لا يوصى بها بالنسبة للمبتدثين. 

ويسمى أحد امتدادات طريقة الأولوية لأكثر الأوجه تحديداً» بطريقة الأولوية 
لثاني أكثر الأوجه تحديداً التي تتعامل مع الوجه الذي يأتي تالياً من حيث التحديد» 
لإجراء عمليات البحث. إلا أن أياً من الطريقتين لا تستعمل.غالباً في أوساط 
استرجاع المعلومات. وطريقة الأولوية لأقل الأوجه تردداء التي تحظى بالمعا جة في 
(1981) صهعه11 0دة اعطء نمع ببساطة» شكل مختلف من طريقة الأولوية لأكثر 
الأوجه تحديداً؛ إذ إن أكثر الأوجه تحديدا عادة ما يسفر عن أقل الأوجه ترددا". 


في الطريق إلى طريقة سريعة وكفء: 

كا المحنا في بداية هذا القسمء فإن كل ما تناولنا من استراتيجيات عمليات 
البحث قد اقترح وتطور في سياق ذروة البحث على الخط المباشر. فقد تغيرت بيئة 
الاسترجاع (كظهور نظم استرجاع الإنترنت على سبيل المثال) ى) تغير من يقومون 
بالبحث أنفسهم (المستفيدون كباحثين دون مساعدة الوسطاء على سبيل المثال)» تغيرا 


(#) واقع الأمر أن النظم الإلكترونية لاسترجاع المعلومات» وخاصة تلك التي تعمل على الخط 
المباشر» تبدأ عملية البحث والمضاهاة بأقل الأوجه تردداء لأن مجموع ما يحتمل استرجاعه من 
وثائقء لا يزيد بحال عن عدد تلك الوثائق المرتبطة بذلك الوجه. (المترجم) 
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جوهريا منذ ذلك الوقت. وبين! لا تزال كل من طريقة كتبل البناء وطريقة الكرة 
الجليدية» لا الأفضلية من جانب بعض المستفيدين» فإن كثيرين يكتفون بمجرد 
طباعة كلمة مفتاحية واحدة يودون البحث بناء عليهاء أو يدخلون عدة مصطلحات 
دفعة واحدة؛ تاركين مسافات بينهاء ونادراً ما يفيدون من المعاملات البولينية وغيرها 
من مقومات البحث ,2160ع516 :2000 6 1وعع5928 © علصامك ,مععصول) 
(1993 ,ععهلله'11 :1993 ,177110 عت روعغه8: على سبيل المثال. ومن الممكن تسمية 
هذه الطريقة بالطريقة السريعة الكفء. ويمكن لقليل من يقومون بإجراء عمليات 
البحث اليوم» تجربة طريقة التجزىء المتتابع» أو طريقة البدء بأكثر الأوجه تحديداً. ومن 
ناحية أخرى» تدخل الآن بعض مقومات أو وسائل البحث (كاللغة؛ والمعاملات 
البولينية على سبيل المثال) في واجهات التعامل مع نظم استرجاع المعلومات. وبإمكان 
المستفيد ببساطة» اللجوء إلى هذه الخيارات من أشكال عمليات البحث. والأزرار 
المحددة سلفاً أو قوائم الخيارات المنسدلة» دون طباعتها فعلاً في عبارات البحث. 


الاسترجاع بالتصفح: 

التصفح عصذووومط شك ادر رئيس لنشاط الاسترجاع. وبالمقارنة بالبحث» 
فإن التصفح لم يحظ بكثير من الاهتام في أوساط استرجاع المعلومات حتى تسعينيات 
القرن العشرين. ونتيجة لتطور نظم الأسطوانات المكتنزة 2-1011©)» ونظم 
الفهارس المتاحة للجمهور على الخط المباشر 0848)6. والعنكبوتية العالمية فائقة 
التنظيم على وجه الخصوصء حظي التصفح بالذيوع بسرعة؛ وأصبح مجديا من 
الناحية الاقتصادية في استرجاع المعلومات» عندما لم يعد المستفيد بحاجة لأن يتحمل 
عبء رسوم الاتصالات»ء كا في حالة النظم التجارية لاسترجاع المعلومات على الخط 
المباشر؛ فبإمكان المستفيدين اليوم استرجاع المعلومات بالتصفح ىا يحلو لهم. 
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ما التصفح؟ 
ذلك من الأنشطة. وفي استرجاع المعلومات يتجه المرء نحو التصفح: 
للحصول على المعلومات عندما لا يكون ا موضوع محدداً بوضوح 
« للعثور على المعلومات التى يصعب تحديدها صراحة 
٠.‏ لإلقاء نظرة عامة على المعلومات التي يوفرها نظام استرجاع المعلومات 
لاختيار المعلومات المناسبة من خليط من المواد الصالحة وغير الصالحة 
٠‏ لاكتشاف المعلومات الجديدة واستيعابها 
عندما تحث بيئة استرجاع المعلومات على التصفح 
ويمكن الاطلاع على أسباب إضافية للتصفح في (1995) تسنهدمنخطءصه31 
بالإضافة إلى معالجات ضافية. وفي حالات من قبيل ”“الإبر وأكوام التبن أيا كانت“ 
(2000) 011ك1؛ يمكن للتصفح أن يكون طريقة استرجاع مفضلة. 
وعند التصفح لا يكون المستفيد بحاجة لأن يعبر عن مشكلة الاسترجاع 
بمصطلحات محددة» | يشترط في عملية البحث. وعلى هذا النحو فإن التصفح 
يتطلب جهداً فكرياً أقل مما يتطلبه البحث. إلا أنه بينن| يقوم بالتصفحء فإن المرء ينبغي 
أن يظل متفاعلاً مع نظام استرجاع المعلومات» من أجل أن يفحص ويقيم المعلومات 
التي يتصفحهاء ويصدر حينئذ أحكام الصلاحية (1995 ,تمتهوفكة30). ومن ثم 
فإن العبء المعرني الملقى على عاتق المستفيد في التصفح أكبر تما هو عليه إذا ما اختار 
البحث نهجًا للاسترجاع. 


وعلى عكس البحث. فإن التصفح يمكن أن يتم كطريقة للاسترجاع دون أي 
تدريب أو تمرس. وى) ذهب مارشيونينى (1995) تصتصمتطء2/19 فإن: 
[التصفح] طبيعي لأنه يربط بين الموارد البشرية العضلية 
والانفعالية والمعرفية» بالطريقة نفسهاء التي يراقب بها البشر العالم 
الفيزيائى ويبحثون عن أشياء مادية. (100 .00. 
وبإمكان المرء.أن يتصفح ما دام قادراً على التنفس. إلا أن هناك أساليب قليلة 
تطورت على النحو المناسبء لتيسير عملية التصفح. وفي متناول المستفيد بوجه عام 
توجيهات أو إرشادات قليلة» يمكن الاعتماد عليهاء حول متى يواصل التصفح من 
أجل المزيد من المعلومات» ومتى يتوقف عن التصفح. ٠‏ 
ويمكن للتصفح. من ناحية أخرى, أن يكون نشاطاً مجزياً؛ إذ يمكن أن يفضى 
إلى المصادفة» أي العثور على شيء مفيد على نحو غير متوقع» نظراً لأن التصفح يكفل 
للمستفيد البحث عن المعلومات عشوائياً وعلى نحو غير منظم. والاسترجاع 
بالتصفح طريقة لا مظاهر قوتها ومواطن ضعفها أيضاً. 
أنواع التصفح: 
على عكس البحث. فإن التصفح لا يبدو طريقة استرجاع منظمة. إلا أن هناك 


أنواعاً مختلفة من التصفح, أمكن التحقق منها ومعالجتها في الإنتتاج الفكري 
(1995 وتستصمتطء" 812 :1997 ,لأكاكلة 1207 :1970 ,“اعطع11 على سبيل المثال). 


ويرى هيرنر (1970) 1165265 أن التصفح يمكن أن يكون موجهاًء أو شبه موجه. أو 
غير مُوجهء وذلك بالتحقق مما إذا كان المستفيد يلتمس كياناً محدداًء وتبعاً لإجراءات 
التصفح المتبعة. كذلك يصنف مارشيونيني (1995) تصتصمتط»318 التصفح إلى 
ثلاث فئات؛ تصفح نسقي» وتصفح استكشافي. وتصفح عرضي. 
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ويتم التصفح النسقي أو الموجه عندما يكون المستفيد على دراية بها يبحث عنه 
بوضوح» كصفحة عنكبوتية بعينهاء في أحد مواقع العنكبوتية العالمية» أو مصطلح 
محدد في معجم مصطلحات على الخط المباشر. أما المستفيدون الذين يمارسون التصفح 
شبه اموجه أو الاستكشافيء فأهدافهم بالنسبة للاسترجاع أقل تحديداًء أو أقل 
وضوحاً؛ فهم يقرؤون بسرعة أو يتفحصون للعثور على ما يسعون وراءه أو 
يلتمسونه؛ فمن الممكنء على سبيل المثال» أن يكون المستفيد على دراية بأن هناك فكرة 
مهمة قد نوقشت في تقرير مطول. وحينئذ يكون على المستفيد تصفح التقرير للعثور 
على الجزء المناسب منه. ويحقق التصفح غير الموجه أو التصفح العرضي أدنى درجات- 
القابلية للتنبؤ من بين الأنواع الثلاثة للتصفح؛ فبدون حاجة بعينها إلى المعلومات؛ 
يتصفح المستفيد في نظام استرجاع المعلومات. ويمكن لأحد الأمثلة أن يكون تنقل 
المستفيد بسرعة من مادة إخبارية إلى أخرى, أثناء تصفحه لإحدى الصحف المعتمدة 
على العنكبوتية العالمية» على أمل العثور على شيء مهم للاطلاع عليه. 
ولدرس التصفح من منظور مختلف. استقصى كوالسكي (1997) لعاوله1>0 
كيف يتصفح المستفيدون ما يحصلون عليه من نتائج البحث: 
.١‏ التصفح بالترتيب الطبقي 8ستكلصهن؛ فنظراً لأن نتائج 
البحث في بيئة الاسترجاع الرقمية» عادة ما تقدم بترتيب 
طبقي» بناء على خوارزميات ترتيب طبقي معينة» يمكن 
للمستفيدين أن يختاروا على سبيل المشال» تصفح النتائج 
التي تحتل طبقة مرتفعة من حيث الصلاحية. 
”. التصفح بالمكان؛ ويدل المكان هنا على الحقول التي عادة 
ما تحدد معالمهاء كحقل العنوان أو حقل المستخلص. ٠‏ 
والعناوين والمستخلصات بعض أمثلة مناطق المحتوى 
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*. التصفح بالنطاق المسلط عليه الضوء؛ فبعض نظم 
استرجاع المعلومات تسلط الضوء على مصطلحات 
معينة (كمصطلحات البحث مثلاً) وسياقاتها» لمساعدة 
المستفيدين في العثور على ما يبحثون عنه» من أجل تحقيق 
الكفاءة. وتلك النطاقات التي تسلط عليها الأضواء 
مرشحة بشكل مناسب للتصفح. 
وفضلاً عن أنواع التصفح التي تناولها كوالسكي 150021514 هناك نوعان 
آخران للتصفح أصبحت لما السيادة في نظم استرجاع الإنترنت؛ أوله] التصفح بالفئة 
والآخر التصفح بالروابط الفائقة. ويتمثل التصفح بالفئة في نظم استرجاع الإنترنت 
القائمة على الدليل (مثل ياهو!). ويتم تكشيف المعلومات التي تجمعها مثل هذه النظم 
الخاصة باسترجاع الإنترنت» وتصنف في فئات (كالحاسبات» والتعليم» والترويح. 
والرياضة على سبيل المثال)؛ فالمستفيد الذي ينتوي العثور على فيلم سينمائي لمشاهدته 
على سبيل المثال» يمكن أن يكون من الطبيعي أن يتصفح فئة الترويح في ياهو!. أما عن 
التصفح بالروابط الفائقة» فإن العنكبوتية العالمية ببنيانها الفائق» لا تجعل هذا الضرب 
من التصفح مجدياً فحسب. وإنا مغرياً إلى حد بعيد أيضاً. 
والروابط الفائقة هي النقاط الارتكازية 20065 والمؤشرات 35ع]01م الكامنة 
في النصوص الفائقة» التي تحاكي التفكير الترابطي 2950121496 للإنسان. فى| أشار 
بوش (1945) طكنا8 فإن: ٠‏ 


العقل البشري يعمل بالربط أو التداعي 50618608وة؛ إذيادة ما 
تحت سيطرته ينتقل بسرعة فورا إلى المادة التالية التى يوحى بها تداعى 
الأفكار» وفقاً لشبكة معقدة من المسارات بخلايا الدماغ (8.106). 
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وقد انعكس هذا الضرب من الترابط أو التداعي» على نحو واضح وشامل» 
على العتكبوتية العالمية بتطبيق الروابط الفائقة. فالعنكبوتية العالمية برمتهاء تتكون من 
معلومات نصية» وكذلك معلومات متعددة الوسائطء متشابكة بعدد لا حصر له من 
الروابط الفائقة. وتلك الروابط بمثابة أدلة بالنسبة للمستفيدين من العنكبوتية العالمية» 
للتصفح. والملاحة» والعثور على المعلومات الرقمية (1997 وناظ0)). ومن شأن نظم 
استرجاع المعلومات فائقة البناء» أن تصبح واحدة من أفضل البيئات:. إن لم تكن 
الأفضل بالنسبة للتصفح. ٠‏ 
استراتيجيات التصفح: 

يمكن للتصفح, كالبحثء أن يتبع استراتيجيات مختلفة. وقد ذكر مارشيونيني 
تستصمتطء:312 أن هناك أر بعاستراتيجيات للتصفح. وهي التفحص 5628) 
والملاحظة ع”#”اع065., والملاحة 283718816, والرصد 220921605. ويمكن لاختيار 
استراتيجية التصفح المناسبة أن يساعد المرء على تحقيق أهداف التصفح على نحو 
أكثر فاعلية. 

وكيا ذهب مارشيونيني (1995) أسصتهدمأطء81. فإن التفحص استراتيجية 
تصفح من أجل التماس الأشياء محددة المعالم جيداً» في بيئة استرجاع معلومات فائقة 
التنظيم؛ يكون المستفيد على دراية با يبحث عنه» وبإمكانه تفحص المعلومات طوليا 
أو انتقائياً. ولكي يتصفح طولياً فإنه يتصفح في فضاء المعلومات تتابعياء وكأنه يمر 
على قائمة النتائج المسترجعة واحدة تلو أخرى. ويعني التفحص الانتقائي النظر فقط 
في قطاعات معينة من المعلومات (كالمداخل أو العناوين» والروابط الفائقة» والصورء 
والمحتويات ذات الألوان المختلفة في موقع العنكبوتية» على سبيل المثال) وذلك من 
بين تلك المحتويات التي يعرضها الموقع. ويبدو التفحص أهم استراتيجية أساس 
بالنسبة للتصفح النسقي. 
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أما الملاحظة؛ في مقابل ذلك» فهي الاستراتيجية الأساس التي تستخدم في 
التصفح الاستكشاني أو العرضي (1995 ,تصتهوأطء::ة38). وينبغي أن يكون المستفيد 
منتبهاً لقطاعات معينة ما تتم ملاحظته؛ في الوقت نفسه الذي يمكن فيه للمكونات 
الأخرى لبيئة استرجاع المعلومات (كالإعلانات على مواقع العنكبوتية مثلاً) أن 
تصرف انتباه المرء وتخبارة أخرى» فإن مدخلات مختلفة ا مإ مناه إل 
المستفيد من مصادر مختلفة ة. وعلى المستفيد أن يحتفظ بتركيزه على ما هو بصدد التّاسه» 
ويتجاهل الشوشرة.والملهيات الأخرى. 

وتوازن الملاحة» كاستراتيجية تصفح. بين تأثير المستفيد والبيئة؛ إذ تقيد البيئة 
التصفح بتوفير مسارات التصفح المحتملة» بينها يهارس المستفيد نوعا من التحكم 
باختيار أي المسارات يمكن أن يسلك (1995 ,تهنههفط»:812).كذلك يمكن 
للملاحة» بناء على التلقيم المرتد لنظام استرجاع المعلومات» أن تستخدم على نحو أكثر 
من التصفح النسقي أو التصفح العرضي. وغالبا ما تستخدم الملاحظة مرتبطة 
بالملاحة. والرصد أو المراقبة تماثل للتفحص فيا عدا تحمله للبيئات سيئة التنظيم 
(1995 ,تصتصمفطء»ة8). وبين) ينظر المستفيدون في النتائج التي يسترجعها النظامء 
على سبيل المثال» يمكنهم أيضاً أن يولوا بعض الانتباه للتقارير الإخبارية التي يتم بثها 
عبر المذياع. وتتم أنشطة التعاس المعلومات متوازية؛ فالرصد أو المراقبة يستخدم في 
الغالب الأعم مع التصفح الاستكشافي. 

وقصارى القولء فإن استراتيجيات التصفح تبدو أكثر غموضاً من 
استراتيجيات البحث التي سبق تناؤها؛ فليست هناك معايير محددة يمكن أن تساعد 
المستفيد في تحديد ما إذا كان التصفح ينبغي أن يتواصل أم يتوقف. وليست هناك 
توجيهات أو إرشادات يمكن للمستفيد اتباعها فيا يتعلق بتغيير استراتيجيات 
التصفح. وعوضاً عن ذلك فإنه يتعين على المستفيد النظر في عدد من العوامل الكيفية 
(كالرضا أو الاكتفاء والجهد المعرفي على سبيل المثال) لأغراض اتخاذ القرار. كما أنه 
ليس هناك أيضاً خط واضح فيا يتعلق بمتى يختار أي استراتيجية» وفي ظل أي 
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ظروف. فهل يمكن للتصفح كنهج للاسترجاع» أن يعمل على نحو أفضل عندما 
يستخدم مرتبطاً بالبحثء بدلا من استخدامه منفرداً؟ ويحاول القسم التالي الإجابة 
عن هذا السؤال. 


تكامل البحث والتصفح في الاسترجاع: 
البحث والتصفح :هجان متميزان للاسترجاع؛ فمنذ حوالي نصف قرن تقريباً» 
قسم لون (1958) سطدم1 طرق الاسترجاع إلى: 
.١‏ استرجاع المعلومات بالنظر في سلسلة مرتبة من التسجيللات 
المختزنة. 
التسجيلات المختزنة. 
*. الجمع بين الطريقتين الأولى والثانية. 
ولقد تغيرت مصطلحات وبنية مراصد بيانات النظمء ولا شك عبر السنين» 
إلا أنه لا يزال من:الممكن أن نرى أن الفئة الأولى التي تناوها لون تمثل التتصفح. بينا 
تدل الثانية على البحث. أما الضرب الثالث فهو الموضوع الذي نحن بصدد 
استكشافه» وهو تكامل التصفح والبحث. 
المقارنة بين نهجي الاسترجاع: 
لقد تناولنا بالوصف خصائص كل من التصفح والبحث في الأقسام السابقة. 


وكا ذهب كوكس (1992) «00). فإنه من الممكن النظر إلى التصفح بوصفه الانتقال 
من أين إلى ماذا. والفكرة وما فيها أن المستفيد يعرف مكانه في مرصد البيانات» ويود 
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أن يعرف ما هو متاح هناك. وفي مقابل ذلك» يمكن النظر إلى البحث بوصفه الانتقال 
من ماذا إلى أين. والفكرة وما فيها أن المستفيد يعرف ما يرغب فيه» ويود معرفة أين 
يتاح في مرصد البيانات. وقد صرح مارشيونيني (1995) فطفههفط3/026 بأن البحث 
هو الاستراتيجية الرسمية والتحليلية» بين| التصفح هو الاستراتيجية غير الرسمية أو 
الإيعازية ©1541:ناعط. وبالإضافة إلى تلك الفروق, يختلف البحث والتصفح بعضها 
عن بعض في المجوانب التي نعرض لا فيما يل. 
الحاجة إلى المعلومات: 

الخاجة إلى المعلومات أحد المعايير الرئيسة التي تميز بين البحث والتصفح 
كنهجين للاسترجاع. وفيما يتعلق بالحاجة المحددة والمعروفة إلى المعلومات» يبدو 
البحث هو الخيار المناسب» إذ يمكن أن يساعد المستفيد فى العثور على "الإبرة” في 
“كومة التبن' بكفاءة. وفي مقابل ذلك يمكن للتصفح أن يستخدم لإنجاز مهام 
استرجاع. لمستفيدين لديهم احتياجات معلوماتية عريضة وغير واضحة المعالم. 
ويمكن للمرء اتباع إجراءات التصفح (كالتفحص أو الملاحة على سبيل المثال) 
لمعرفة ما إذا كانت هناك أي معلومات في نظام استرجاع المعلومات» مناسبة 
لاحتياجاته المعلوماتية. 
الكفاءة واحتمالات التحسن: 

ينبغي وضع الكفاءة في الاسترجاعء واحتتالات التحسن. في الحسبان عند 
مقارنة البحث بالتصفح. ويمكن القول بوجه عامء أن البحث سريع» ومركز» ويدخل 
فى الصميمء بين| التصفح يمكن أن يكون مستنفذاً للوقت. ولا يقصد به أن يكون 
نشاطاً مركزاً. كذلك يبدو أن المستفيد يمكن أن يكون هناك ما صرف انتباهه في 
التصفح. وبين) تتاح للمستفيد أساليب متعددة لتوسعة البحث أو تضييقه» لا تتوافر 
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للتصفح سوى إمكانيات ضئيلة للمساعدة على الارتفاع بمستوى الأداء. وفضلاً عن 
ذلك فإنه لا يمكن للمستفيد الحصول على المعلومات؛ إلا من تلك القطاعات التي 
يتصفحها في النظام. ومن الممكن نظرياً للتصفح أن يتواصل؛ مالم يضع المستفيد نهاية 

له. وفي الوقت نفسه. يمكن لدقة التصفح أن : تتراجع في مثل هذه العملية المطولة 
(1995 متستصمتطء: ه11). 


العبء المعرفي: 
من الممكن تقسيم عملية البحث برمتهاء إلى حوالي ثلاث مراحل؛ التعبير عن 

الاستفسار» وإجراء عملية البحثء ثم تقييم التتائج. ومن الممكن للعبء المعرفي الملقي 
على عاتق المستفيد» أن يكون عالياً في المرحلتين الأولى والثالشة» ومنخفضاً نسبياً إذا ‏ 
يحاول المستفيد أن يكون متفاعلاً أثناء البحث. أما التصفح. في مقابل ذلكء فعملية 
تفاعلية بدرجة كبيرة» في جميع المراحل» بين النظام والمستفيد. ويصبح التصفح لا مبرر له 
إذا لم يتفاعل المستفيد مع النظام» ويظل منتبها لما يقدمه النظام. ومن المرهق بالنسبة للمرء 
ايل زكرا و يع الصف لله لوول :)أنه يحون طايه صل تسيو بتراميال 
وسريعء تقييم المعلومات التي يتصفحها وفقاً لمحددات معينة. إلا أن التصفح يعتمد على 
التحقق من المعلومات ذات الصلة لاعلى الاسنتدعاء من الذاكرة © 1600 ,©58ق.آ) 
(1999 ,توا الأمر الذي يمكن أن يخفف من العبء المعرفي الملقي على 
عاتق المستفيد. 

الصدفة: 


تكاد احتماللات الصدفة في البحث تكون منعدمة 5 تقريباًء نظراً لأن النظام يقوم 
في الأساس على مضاهاة الاستفسار مقابل ما يشتمل عليه مرصد البيانات. فليس من 
المجدي ولا من المحتمل» بالنسبة للمستفيد أن يتفحص النظام كاملاً لاستكشاف 
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معلومات إضافية. وفي مقابل ذلك فإن التصفح يفسح المجال للصدفة. وقد لا يعجب 
المستفيد حين يجد شيئاً مفيدأء على نحو غير متوقع أثناء التصفح. إلا أن هذه الميزة في 
التصفح يمكن أن تصبح أيضاً وبسهولة» مصدراً لصرف الانتباه أو فقدان الاتجاه» 
وهذا قصور أشار إليه الباحثون؛ ومن بينهم مارشيونيني (1995) تستدمقطءة]/3. 


الحهود: 

البحث جهد متنضبظ» يتطلب من المرء التدريب والتعرس» حتى يكون قادراً 
على إنجازه. وفي مقابل ذلك» فإن التصفح نهج استرجاع فطري بالنسبة للمستفيد.. 
الذي لايحتاج لإنفاق وقت في تعلمه. وفضلاً عن ذلك. لا تنطوي عملية التصفح 
على تعبير عن الاستفساراتء الأمر الذي يمكن أن يخفف عن كاهل المستفيد عبء 
تلك المهمة بالغة التعقد» ويكفل له التركيز ببساطة على التصفح. 

ويلخص اللجدول رقم ١/56‏ المقارنة بين الب لبحث وا لتصفح. في خمسة 
جوانب مختلفة. 
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النهج المتكامل: 

يتبين من المقارنة» في الجدول رقم »٠/7‏ أن لكل من البحث والتصفح مظاهر 
قوته وأوجه قصوره. ويعمل كل نبج للاسترجاعء على نحو مناسب. في ظل شروط 
وظروف معينة. وعلى الرغم من أن هناك مناسبات تبدو فيها إحدى طرق الاسترجاع 
أكثر ملاءمة من غيرهاء فإنه يمكن للتكامل بين النهجين أن يفضي إلى أداء استرجاع 
أفضل بوجه عام. وقد لا تكون هناك حاجة إلى البحث في كل مهمة من 
مهام الاسترجاعء إلا أن التصفح دائياً ما يكون ضرورياً في الحكم على صلاحية 
النتائج المسترجعة. 

يضاف إلى ذلك أن نظم استرجاع المعلومات مصممة لتشجيع النهج المتكامل 
في أوساط استرجاع المعلومات. وني نظم استرجاع المعلومات التي تطورت في وقت 
مبكر (ديالوج 113108 على سبيل المثال)؛ تناح قوائم الاختيار وخيارات البحث 
تزامنيً» بحيث يمكن للمستفيد أن يفاضل بين التصفح والبحث وفقاً للحاجة. أما 
بالنسبة لنظم استرجاع الإنترنتء التي تطورت في نباية تسعينيات القرن العشرين» 
فإن القاعدة هي أن يكون هناك دليل؛ وتقنية بحث جنباً إلى جنب. وعلى خلاف 
الزمن الذي ظهرت فيه نظم استرجاع الإنترنت لأول مرة للجمهوره فإن هذه النظم 
إما أن توفر دليلاً (مثل ياهو!) أو تقنية بحث (مثل ألتافيستا 411488315]2) وليس 
كلهيما. ولحسن الحظ فإن كثيراً من نظم استرجاع الإنترنت» سرعان ما أدركت مزايا 
دعم كل من التصفح والبحث في نطاق نظام الاسترجاع الواحد» ومن ثم غيرت من 
ممارساتها القديمة. ولا نكاد اليوم نجد أيا من نظم استرجاع معلومات الإنترنت» 
يوفر خيار استرجاع واحد فقط للمستفيد. 


| ويلجأ المستفيدون للنهج المتكاملء نظراً لأنهم لا تتوافر لهم المقومات المناسبة 
لمهمة الاسترجاع المناسب فحسبء وإنما يحصلون أيضا على المزيد من النظم نفسها. 
فياهو!؛ على سبيل المثال» يدعم البحث في نطاق فتاته القابلة للتصفح (كالفنون 43:05 
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على سبيل المثال). ومن ثم» فإن البحث في نطاق فئة قابلة للتتصفح» يشبه البحث في 
مرصد البيانات المتخصص في أحد المجالات التي تمثلها الفئة القابلة للتصفح. ويقصد 
بذلك القول أن البحث في ياهو!ء في نطاق فتته الخاصة بالفنون» يشبه عمليات البحث 
في مراصد بيانات الفنون والآداب. ويصبح التصفح والببحث نشاطين متكاملين في 
هذه البيئة. وعلى النحو نفسه. فإن نتائج البحث في نظام لاسترجاع المعلومات (مثل 
كلاستي" 'إ1!151)) تتجمع تلقائيا لتيسير التصفح. 

ويمكن لواحد زائد واحد أن يكون أكثر من اثنين» إذا ما تم تكوين المجموعة 
بحكمة. ويصدق ذلك بالنسبة لنهج الاسترجاع المتكامل الذي نتناوله هنا. 


() أحد محركات البحث الفائقة» أو ماوراء تحركات البحث عطتعمةء طاعمردءه-هاعتد. (المترجم) 
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الفصل السابع 


تماذج استرجاع المعلومات 


يعرّف الأنموذج 220061 بأنه ”"وصف تقريبي مؤقت لنظرية أو نظامء يفسر 
جميع خصائصه المعروفة“ (1984 ..1ة اع ,امسقطءان580). وقد تطورت ناذج ختلفة 
في استرجاع المعلومات؛ على مر السنين. ويقدم هذا الفصل ويستكشف بعض النماذج 
المألوفة لاسترجاع المعلوماته من أجل تيسير فهم ممارسسات 
استرجاع المعلومات وتقدير أسسها. 

وهناك مستويات متعددة» يمكن فيها نمذجة استرجاع المعلومات. وتستدعى 
نظريات وأفكار من المجالات التخصصية الأخرى (كالمنطق البوليني» والفضاء 
المتجهي 58966 760107 والاحتمالات على سبيل المثال) لتشكيل أسس نمذجة: 
أنشطة استرجاع المعلومات. وقد اقترحت عدة خطط مختلفة لتصنيف جميع نماذج 
استرجاع المعلومات. التي تم تطويرها حتى الآن (-70أء116 عق معاولآ-متعدظ 
7 ,أأع71111 عه وعصمل علء«قم5 :1987 ,10ه0؟) عه ستئلاء8 :1999 ,مئاء< 
على سبيل المثال). وقد توسع إنجورسن وييرفلين «لاء عمقل 200 معوضء م108 
(2005) في التقسيم ال رمي لناذج استرجاع المعلومات, الذي طوره بلكن وكروفت 
(1987) غ501ن) لسهه ستطاءظ إلى كل من المضاهاة الدقيقة قصتطءاهم أاعويي 
(انظر الشكل 5 7أ) وأفضل مضاهاة 222112138 6»56 (انظر الشكل رقم "ب 
في كتابهم|). ويركز هذا الفصل على النماذج الموجهة للنظم, أو التي تركز على النظم 
0عاطع1ه ممعؤونزى كالمتطق البوليني» والفضاء المتجهيء» والاحتالات. 
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وسوف نتناول الناذج الأخرى لاسترجاع المعلومات (كالأنموذج المعرفي الموجه 
للمستفيد» أو الذي يركز على المستفيد 11861-0116460 على سبيل المشال) في فصول 
أخرى, حيث)| يكون ذلك مناسبا على نحو أكثر التزاما بالمنطق فيا يتعلق بالمحتوى 
الملوضوعي. 


المضاهاة ليست من ناذج استرجاع المعلومات» وإنما تضع الأساس 1 
لأنشطة استرجاع المعلومات. وكا بينا في القسم »١ /4 /١‏ فإن المضاهاة هي التقنية 
الأساس في استرجاع المعلومات؛ فمن الممكن إجراء المضاهاة بين المصطلحاتء أو 
بين مقاييس التشابه كالمسافة وتردد المصطلحات. ويتم إجراء مضاهاة المصطلحات 
مباشرة مقابل المصطلحات المستقاة من الاستفسارات أو الوثائق أو بدائلهاء أو المعينة 
للاستفسارات أو الوثائق أو بدائلهاء بين يتم إجراء مضاهاة مقاييس التشابه على نحو 
غير مباشرء مقابل المقاييس التي يتم الحصول عليها بحساب المسافة بين المتجهات»ء كا 
في أنموذج الفضاء المتجهي على سبيل المثال. ويركز القسمان الفرعيان التاليان على 
مناقشة هذين الضربين من المضاهاة. 
مضاهاة المصطلحات: 

كما بينا في القسم 7/ »٠/١‏ فإن المصطلحات التي تستعمل في تنظيم المعلومات 
واسترجاعهاء يمكن أن تكون كلمات مفتاحية» أو واصفاتء أو معرفات أو محددات 
للهوية. كذلك تشمل المصطلحات اكرات أو العيبارات»ء أو الأنواع الأخرى من 
وسائل التعبير. وفضلا عن ذلك يمكن مضاهاة المصطلحات بإحدى الطرق الأربع 
التالية» وهي المضاهاة الدقيقة:؛ والمضاهاة الجزئية؛ والمضاهاة الموضعية» 
ومضاهاة المدى. 
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وتعني المضاهاة الدقيقة أن يضاهي التعبير عن الاستفسارء التعبير عن الوثيقة 
تمام المضاهاة في نظام استرجاع المعلومات. والبحث بمراعاة شكل الحرف الأول؛ 
والبحث بالعبارة» من أمثلة المضاهاة الدقيقة؛ '“فتنقية العنكبوتية'' قمتت)1؟ طعوى 
على سبيل المثال» مصطلح ورد في استفسار ماء كذلك ترد العبارة نفسها في النظام 
المزمع البحث فيه؛ حينئذ يتم الحصول على المضاهاة الدقيقة نتيجة للبحث. 


وعل عكسن المضاهاة الدفيقة قيقة» فإنه في المضاهاة المزئية» يضاهي جزء فقط من 
مصطاح الاستفسار مقابل طريقة 5 عور عن الوكيقة َه في نظام استرجاع المعلومات. 
والبتر في البحث مثال تقليدي للمضاهاة الجزئية؛ فمن الممكن على سبيل المثال» لبحث 
استفسار *121201087ع©) 12101*53211011 (حيث النجمة هي رمز البتر) أن يستر جع 
الوئائق التي تشتمل عل (08[مضطءع) «ملأقصسضم صل رو «متأمصسضمكصا 


5ع ر كأوأعه1مصطءع! 105)ددمطم 1ص نتيجة المضاهاة الحزئية. 


أما المضاهاة الموضعية 0051410881 فتتم بوضع المعلومات الموضعية في 
الحسبان. في عملية المضاهاة. والبحث بالتقارب إحدى الحالات الجديرة بالنظر؛ فإذا 
كان استفسار البحث هو 56086 115/1111 40هكناء فإنه يمكن للنتائج المسترجعة أن 
تشمل الوثائق التي تشتمل على عبارات مثل " متجر الكتب المستعملة” ع[00ط 0عون 
560 و'”متجر الملابس المستعملة '' 5608 ع8طتطامك 0عوت و”متجر الأثاث 
المستعمل '* ©5405 ع15ا]1ه:1نا1 560. فالمضاهاة بين الاستفسار وطريقة التعبير عن 
الوثائق هناء تتم بالكلمتين الأولى والأخيرة فقطء بين| يتم تجاهل الكلمات الواردة في 
موضع الوسط في عملية المضاهاة. 

ومن الممكن تطبيق مضاهاة المدى طء2286 ع28قهة في وسائل التعبير العددية 
11111 (كحجم المبيعات مثلا)؛ أو وسائل التعبير بالترتيب الطبيعي (مثل يناير» 
فبراير» ... ديسمير). فا تتم مضاهاته في مضاهاة المدى. هو الحد الأعلى للمدى 
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(مطبوعات ما قبل عام »)275٠١7‏ أو الحد الأدنى للمدى (مثل مطبوعات ما بعد عام 
17 ايأو كليهها (مثل مطبوعات مابين .)390٠١1١9319947‏ ومراصد البيانات 
العددية 11 مدناط وتواريخ التعر امقلة تقليدية للبحث بالمدى. 

وتتعلق هذه الأنواع الأربعة المختلفة لمضاهاة المصطلحاتء بالاستفسارات 
الأصلية» وطرق التعبير عن الوثائق» دون أي حسابات أو تحويل. وينظر إلى مضاهاة 
المصطلحات في الغالب الأعمء في أنموذج المنطق البوليني. أما في الناذج الأخرى 
لاسترجاع المعلومات (مثل الفضاء المتجهي والاحتالات) فلاتتم مضاهاة 
المصطلحات الواردة في الاستفسارات» مقابل وسائل التعبير عن الوثائق» على 
نحو مباشره وإنما يمكن تحويل المصطلحات إلى بتعض مقاييس التشابه قبل 
أن تنم مضاهاتها. 
مضاهاة مقاييس التشابه: 


من الممكن لمضاهاة مقاييس التشابه أن تطبق بعدد من الطرق المختلفة؛ ففي 
أنموذج الفضاء المتجهي, على سبيل ال مثال» تستند المضاهاة على المسافة بين المتجهات 
أو درجة زاوية المتجه؛ وكل) انخفضت زاوية المتجه؛ ارتفعت درجة التشابه 
بين الاستفسارات والوثائق. أما في الأنموذج الاحتالي فإنه من الممكن حساب 
التشابه اعتمادا على تردد المصطلحات. لتحديد احتتهالات العلاقة الوثيقة بين 
الابكفسار انع و الوثاتق. 

وعند إجراء هذا النوع من المضاهاة؛ يتعين اختيار مقياس للتشابه خلاف 
المصطلحات نفسها. فبناء على هذه المقاييس تتم المضاهاة في النهاية. ومن ناحية 
أخرى» تكفل مضاهاة مقايبس التشابه طرقا أخرى إضافية لإنجاز مهمة الاسترجاع. 
ويمكن لمثل هذه ال مارسات؛ من ناحية أخرىء أن تؤدي إلى وقوع أخطاء وحدوث 
شوشرة» وخصوصا في عملية الحصول على مقاييس التشابه. 


238 


وبصرف النظر عن نوعية المضاهاة» فإن المضاهاة هى الأسلوب الأساس في 
استرجاع المعلومات. وتوضح ناذج استرجاع المعلومات, التي تناولناها هنا كيف تتم 
المضاهاة في مختلف الظروف. جنبا إلى جنب مع خصائص الناذج ومزاياها وأوجه 
القصور التي تكتنفها. 


أنموذج المنطق البوليني: 

سمي أنموذج المنطق البوليني باسم جورج بول ©8001 0786 6). الذي اقترح 
المنطق البوليني في منتصف القرن التاسع عشر. ويشمل المنطق البوليني ثلاث عمليات 
منطقية؛ هي الناتج المنطقي () أع1لمتم لمعتعم1» و الملجموع المنطقي لدءاعه1 
(+) تصدى والفارق المنطقى (-) 01416762 1هن3ع10. وتستعمل ثلاثة معامللات 
مقابلة. هي ”و“ لالش و””أو“ 012» و”فييا عدا“ 18007 للتعبير عن العمليات 
المنطقية في استرجاع المعلومات. وني الطبعات المبكرة لبعض نظم استرجاع الإنترنت» 
كانت علامة زائد (+) تستعمل للتعبير عن المعامل ””و“» الأمر الذي ربما يكون قد 
امب لي اخاد لمحا ره ا ل 

'أو” في المنطق البوليني. 

ويجمع الناتج المنطقي أو المعامل ”و“ بين مصطلحين أو أكثر في صيغة البحث» 
ويشترط وجوه جميع المضطلحات في الوثائق المؤهلة لللاسترجاع. أما المجموع المنطقي 
أو المعامل ”أو“ فيربط بين مترادفين أو أكثرء أو مصطلحات متصلة في صيغة البحث. 
ويمكن النظر إلى الوثائق التي تشتمل على أي من المصطلحات الواردة في صيغة 
البحثء» بوصفها ضربات صائبة أو تسديدات هائط أو نتائج متوقعة. أماالفارق 
المنطقىء أو المعامل ”فيا عدا 72071“ فيحد من عمليات البحث,. باستبعاد 
المطلحات التي ترد بعد المعامل ”فيا عدا“ في الاستفسارات. وقد وردت أمثلة 
بعينها لاستعمال المعاملات البولينية في القسم »١/١/5‏ عندما تعرضنا لتقنية 
البحث البوليتي: 
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وكا بينا في القتسم ١/5/١01١‏ فإن مورتيمر تاوبه ©1815 110015361 أدخل 
المنطق البوليني إلى استرجاع المعلومات. ومع التطور السريع للنظم الإلكترونية 
لاسترجاع المعلومات» تزايد تبنى واستعبال المنطق البولينى. وعندما انتقلنا إلى العصر 
الرقميء فإننا قلما نجد من نظم استرجاع المعلومات ما لا يدعم الأنموذج البوليني 
للبحث. وواقع الأمر أن أنموذج المنطق البوليني قد أصبح يطبق على نطاق واسع 
كتقنية لاستر جاع المعلومات (1997 ,]771116 عه 5عدمل عاءمقم5). إلا أن ذلك لا 
يعني أن المنطق البوليني أنموذج لاسترجاع المعلومات لا يكتنفه قصور. بل العكس» 
إذ يمكن أن نجد مناقشات حول مظاهر القوة ومواطن الضعف في أنموذج المنطق 
البولينىء في كثير من الوثائق ( ,11825 و1988 ,اعم000) :1999 ملإعسستطلمط0) 
7 رااء17111 © كعصمل عاءمقم5 1997 رعوقط ته :1999 ,.1له اء على 


سبيل المثال). 
مظاهر قوة أنموذج المنطق البوليني: 

يدل الاستخدام المكنف لأنموذج المنطق البوليني في استرجاع المعلومات؛ على 
مالمذا الأنموذج صن أهمية؛ فهو أولا يدعم المعالجة البارعة 0321011120108 لمختلف 
الأوجه الناتجة عن تحليل الاستفسارات أو الوثائق. فبإمكان المعامل ”و“ 4112 
الجمع بين وجهين بسيطين لتشكيل وجه مركبء وبذلك يضيق من مجال البحث. 
ويكفل المعامل ”أو“ +01 تحديد الأوجه البديلة للاستفسار أو الوثيقة» ومن ثم 
توسعة مجال عملية البحث. أما المعامل ””فيها عدا 71071 فبإمكانه عزل الأوجه 
المركبة في أوجه مفردة بسيطة» ومن ثم استبعاد الأوجه غير المرغوب فيهاء بحيث لا 
تظهر في نتائج البحث النهائية. ويمكن لمثل هذه المعالحة البارعة» إذا ما طبقت على 
النحو السليم» أن تضفي المرونة والفاعلية على استرجاع المعلومات» على مستوى لا 
يمكن لأي ناذج أخرى لاست رجاع المعلومات أن تباريه. 
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ثانياء تبدو نظم استرجاع المعلومات المعتمدة على المنطق البوليني فعالة من 
حيث التكلفة 1]/6»117©-6050) ولا غنى عنها أيضا بالنسبة للمستفيد اع رقاهة7) 
(1999 ..[8. وهناك الآلاف من نظم استرجاع المعلومات القائمة على المنطق البوليني» 
العاملة فعلا. وبإمكان المستفيد النهائي استعمال المعاملات البولينية لتوسعة مدى 
عملية البحث أو تضييقهاء أو استبعاد نتائج معينة من البحث. وعلى هذا النحو يبدو 
أنموذج المنطق البوليني مستقراء وإن كان بعض الباحثين (1987 ,]01«ك1 يق صأعااء8 
على سبيل المثال) يرون أن الأنموذج قد أصبح مستقرا من خلال المارسة أكثر منه من 
خلال النظرية. 

ثالثاء يبدو أنموذج المنطق البوليني مفهوما على نحو مناسب 10865 علع5ةم5) 
(1997 ,7811164 #. وإن كانت المناقشات حول ما يمكن للأنموذج أن يحققه أقل 
بكثير من المناقشات حول ما يععجز الأنموذج عن تحقيقه. وهذا أمر يمكن أن يكون 
ناتجا عن عاملين؛ أولهما أن أنموذج المنطق البوليني هو الأقدم من بين كل نماذج 
استرجاع المعلومات. ومن المسلم به أن مظاهر قوته تحظى بالتقدير المناسب إلى حد لا 
يدعو للمزيد من التحسن. والعامل الثاني هو أن المنطق البوليني» بوصفه أقدم نماذج 
استرجاع المعلومات» يمكن أن يُنتقد كلما ظهر أنموذج جديد لاسترجاع المعلومات. 
ومن الطبيعي للمرء أن يعلن أن أنموذجا جديدا لاسترجاع المعلومات» قد صمم 
للتغلب على أوجه قصور الأنموذج القديم. ويمكن لمصمم النظام؛ شأنه شأن 
المستفيد» أن يفضل العمل بأنموذج مفهوم با فيه الكفاية. 

رابعاء أن نظم استرجاع المعلومات القائمة على المنطق البوليني» سهلة نسبيا في 
بنائهاء نظرا لأن الخوارزميات التي ينطوي عليها التصميم؛ تبدو أكثر بساطة في 
تطبيقها من تلك التي تقوم على ناذج أخرى لاسترجاع المعلومات. ويمكن لذلك أن 
يسهم جزئيا أيضا في اتساع نطاق تطبيق النظم البولينية لاسترجاع المعلومات. ونظرا 
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لمظاهر القوة التي سبق ذكرها (كأسلوب المعالجة البارعة» والاستخدام على نطاق 
واسع على سبيل المثال) فإن أنموذج المنطق البوليني دائما ما يحظى بقدر كبير من 
الاهتمام حيثم| تكون نماذج استرجاع المعلومات موضوعا للتدقيق التحليلٍ. 
أوجه قصور أنموذج المنطق البوليني: 

حظيت أوجه قصور أنموذج المنطق البوليني» كما سبق أن بيناء بالدرس 
والاستكشاف على نحو ضاف في كثير من الوثائق ( :1999 ,لإتتتتطل٠مط)‏ 
5 عاء 1مك 1997 101125 :1999 له أء ركامدع2 19885 ,رعم000) 
7 ,4ا711116 » على سبيل المثال) . والمناقشة التالية هي خلاصة أوجه قصور 
ذلك الأنموذج. 

أولاء من الصعب على المستفيد إجراء عمليات البحث البوليني بدون درجة 
مناسبة من التمرين والتمرس. وتكمن الصعوبة في جانبين: )١(‏ من الصعب بالنسبة 
للمستفيد اختيار المعامل البوليني المناسب؛ فدائم) ما يكون هناك خلط بشأن المعاملين 
”و“ 0ه و ”أو“ 01. في أوساط المستفيدين» نظرا لأن لماتين الكلمتين معانٍ 
مختلفة في المغزى التقليدي أو الدلالة المشتركة؛ فكلمة 880 تعني تقليديا زائد كناآصٍ 
كما في ”إنهم سيبحثون عن هذا الموضوع في ألتافيستا 414817158“ و”جوجل 
©اع00''. على سبيل المثال» بين| تعني كلمة 8ه أيَّا من عه0 #عطلاع. كما في 
“سيبحثون عن هذا الموضوع في ألتافيستا” أو ”جوج ل" » على سبيل المثشال. ومن 
الممكن نظريا البحث في مواقع في ال حالة الأولى» أكثر نما يحدث في الحالة الأخيرة. 
وعادة ما يفكر بعض المستفيدين على النحو نفسه؛ عندما يصوغون الاستفسارات 
البولينية» أي أنهم يستعملون المعامل (4771 عندما يكونوا راغبين في الحصول على 
نتائج كثيرة» ويستعملون المعامل 05 عندما يكونوا راغبين في نتائج قليلة. وتما لا شك 
فيه أن المنطق البوليني لا يعمل على هذا النحو. ومن المحتمل لهذا الفارق أن يؤدي إلى 
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اختيار المستفيد للمعاملات غير المناسنبة» أي يستعمل المعاملين 4112 و01 في 
السياقات غير المناسبة. (؟) من الصعب بالنسبة للمستفيد أن يتبع تسلسل المعالجة على 
عوض هعم هينات البعندها الحولني الركية. وكما أ وف عاق القسدم 
١/١/1١05‏ فإن عمليات البحث البوليني المركبة تنطوي على أكثر من ضرب واحد 
من المعاملات البولينية» ويتم تحديد التسلسل الطبيعي للبحث على النحو التالي: يأتي 
المعامل ””فيها عدا“ 78101 أولاء ويأتي المعامل ”و“ 41/2 ثانياء بين يأتي المعامل 
"أو 01 أخيرا. إلا أنه من الممكن تغيير التسلسل الطبيعي للمعالجة» بالنسبة” 
لعمليات البحث البوليني المركبة» باستعمال الأقواس حين| تدعو الحاجة. غير أن مثل 
هذا التغيير معقد ويتطلب الكثير» وخخصوصا بالنسبة للمبتدئين. فقد لا يكون المستفيد 
قادرا على التكيف مع القواعد الاصطناعية (كمعالجة الأقواس الطولية أو الموغلة 
82612051 قبل غيرهاء على سبيل المثال) من أجل تغيير التسلسل الطبيعي 
للمعالجة» بالنسبة لعمليات البحث البوليني المركبة» مالم تتح له فرصة التدريب 
والتموسشن الخلاقمة. 

ثانياء من الصعب التعبير عن العلاقات غير البولينية بين المصطلحات (علاقة 
السببية على سبيل المثال) نظرا لأن هذا الأسلوب غير متوافر ببساطة في الأنموذج. 
لنفترض أن مستفيدا يود العثور على بعض المعلومات حول تطبيقات الحاسب في 
التعليم. حينئذ تتم صياغة استفسار بحث باستعمال المعامل البوليني "و 410/1: 
”الحاسبات والتعليم” عن آل 5اءأناممرمن. ولا يرد مصطلح 
'“التطبيقات'“ 11624105م20 في الاستفسار, نظرا لأن هذه العلاقة من المفترض أن يتم 
التعبير عنها عن طريق المعاملات البولينية» إلا أن أيا من هذه المعاملات لا ينهض مبذه 
الوظيفة. ومن ثم فإنه يإجراء عملية البحث “الحاسبات والتعليم ' يمكن للمستفيد 
أن يحصل على معلومات», لا حول استخدام الحاسبات في التعليم فحسب. وإنما حول 
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تعليم الحاسبات أيضا. ويمكن ولااشك لصيغ البحث البوليني أن تكون في غاية 
التعقد. إلا أنه لا يزال هناك ثلاثة معاملات فقط متاحة للمستفيد» لكي يربط بها بين 
المفاهيم التي تتضمنها عملية البحث. ومما لاشك فيه بوجه عام؛ أنه كلما ازدادت 
صيغة البحث تعقدا زادت احتالات تسببها في التفسيرات غير الصحيخة؛ نظرا لعجز 
أنموذج المنطق البوليني عن التعبير عن علاقات أخرى خلاف علاقات المنطق 
البوليني بين المصطلحات. 

ثالثاء ليست هناك تقنية للوزن متاحة في أنموذج المنطق البوليني» لبيان الأهمية 
النسبية لمختلف المفاهيم في استفسار البحث. ومن المفترض أن تكون لجميع 
المصطلحات أو المفاهيم في الاستفسارات البولينية» الدرجة نفسها من الأهمية» الأمر 
الذي لا يصدق دائا في استرجاع المعلومات. فإذا افترضنا على سبيل المثتال» أن 
استفسار البحث هو ”الوصول إلى المعلومات والأمن“ ووع266 صمتكهسممكصة 
(اثتناءء5 4112» ويود المستفيد أن يركز أكثر على مصطلح ”الأمن“. وبعبارة 
أخرىء يود المستفيد الحصول على معلومات حول قضية الأمن في الوصول إلى 
المعلومات» بدلا من معالجة المصطلحين بوصفهما متساويين في الأهمية. إلا أنه في نظام 
بوليني لاسترجاع المعلومات» قد لا يكون من الممكن تلبية توقع المستفيد» نظرا لعدم 
إمكان تخصيص أوزان لمصطلحات الاستفسارات. 

رابعاء من المستحيل التعبير عن الصلاحية الجزئية لنتائج عملية البحث. في 
أنموذج المنطق البوليني» نظرا لأن هذا الأنموذج ببساطة» يقسم جميع البيانات 
المتوافرة في النظام إلى فئتين؛ صالحة عندما تكون هناك مضاهاة بين الاستفسار وبدائل 
الوثائق» وغير صا حة عندما لا تكون هناك مضاهاة. وليست هناك فئة وسطء ومن ثم 
فإن نظم المنطق البوليني لا يمكن أن تقدم نتائج مرتبة تنازليا وفقا للصلاحية. ونظرا 
لأنه ليست هناك محرجات مرتبة طبقياء فإنه لا يمكن للمستفيد أن يقررء على سبيل 
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المثال» استرجاع الوثائق الخمسة عشر المتربعة على القمة. وعلى المستفيد غربلة جميع 
النتائج» التي أحيانا ما تعد بالآلاف أو أكثر» التي لا يقدمها النظام البوليني في ترتيب 
معين للصلاحية. وعلى هذا النحو فإنه لا سيطرة للمستفيد على حجم المخرجات في 
عمليات البحث البولينية. 


خامساء يمكن للمستفيد أن يحصل على رجات لا طائل من ورائها على 
الإطلاق» أو مخرجات تشكل عبئا زائدا عليه» عند إجراء البحث البوليني. ويمكن 
للمخرجات أن تكون لا طائل من ورائها إذا كان استفسار البحث مقيدا إلى حد بعيد» 
كا هو الحال على سبيل المشال» عندما تكون هناك عدة مصطلحات مرتبطة معا 
بالمعامل ””و“. ومن ناحية أخرى» يمكن للمخرجات التى تشكل عبئا زائدا أن تتأتى 
فعلاء إذا كان استفسار البحث عريضاء كا هو الحال 0 المثال؛ عندما ترتبط 
عدة مصطلحات معا بالمعامل ”أو“ 012. وبإمكان المستفيد تعديل استفسار البحث 
لزيادة محرجات عمليات البحث أو الحد منها. إلا أن الناتج حينئذ لن يكون ما كان 
يبحث عنه المستفيد من البداية» وإنما مخرجات الاستفسار المعدل. 

وللتغلب على ما يكتنف الأنموذج البوليني من قصورء اقترح كوبر 
(1988) اع م200) بعض الحلول الممكنة» كصياغة الاستفسارات خالية من المعامللات 
البولينية» لتجنب عدم تعاطف الاستفسارات البولينية مع المستفيد: ومن المقترحات 
الممتازة لكوبر استمارة.البحث 50883 81©13ع5, على الرغم من أن هذا الاقتراح لم يطبق 
على نطاق واسع حتى خباية تسعينيات القرن العشرين. وفضلا عن ذلك تم أيضا 
تطوير عدد لا بأس به من الخوارزميات والطرقء بم في ذلك نماذج استرجاع 
المعلومات» من أجل توفير خرجات مرتبة طبقياء ومدخلات موزونة» وما شابه ذلك. 
إلا أن ”ناذج الاسترجاع الأخرىء التي يمكن أن تكون جديرة بالاهتمام نظرياء لم 
تحقق في التطبيق نتائج تفوق على نحو بارزء تلك النتائج الخاصة بنظم الاسترجاع 
البولينية''(63 .2 ,1997 رع10:188) . 
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أنموذج الفضاء المسجهي: 

تطور أنموذج الفضاء المتجهي 50866 766401, الذي يعرف أيضا بالتجهيز 
المتجهي أو استرجاع الناتج المتجهي, على يدي سالتون 5816408 وزملائه» الذين بنوا 
نظام معالجة النصوص واستر جاعها 220 20102[نامتشقطم عط 10 مرعاوزك 
كالاء) 014 [51698]»(سمارت '5114141)» ليكون بمثابة أساس لإجراء سلسلة 
طويلة من تجارب استرجاع المعلومات (1968 ,8314082 على سبيل المثال). كذلك 
صممت سلسلة من أساليب استرجاع المعلومات (وزن المصطلحات. والمخرجات 
المرتبة طبقياء والتلقيم المرتد للصلاحية» على سبيل المثال) في سياق عملية بناء 
الأنموذج. وإلى جانب المنطق البوليني» كان لأنموذج الفضاء المتجهي أكبر تأثير على 
تطور استرجاع المعلومات» ونظم استر جاع المعلومات العاملة © وعصمل عاءوم5) 
(1997 باغء17111آ. 


وفي أنموذج الفضاء المتجهيء يتم تحديد كل مصطلح بوصفه أحد الأبعاد» بين| 
يتم التعبير عن كل استفسار أو وثيقة بوصفه متتجها. ويتكون المتجه فعلا من قائمة من 
قيم المصطلحات تمثل مادة ما (أي استفسار أو وثيقة). ومن الممكن لقيم المصطلحات 
في المتجه أن تكون ثنائية أو موزونة. ويمكن للقيم الثنائية أن تكون واحد أو صفرء 
حيث يدل الواحد على وجود المصطلح في المادة. أما القيم الموزونة فتشمل أعدادا 
إيجابية حقيقية (مثل »٠.6‏ و”".٠»‏ و7.5»و0.5). وتقابل القيمة الموزونة لكل 
مصطلح الأهمية النسبية لذلك المصطلح, في تمثيل هذه المادة (1997 ,أك51[ة::060). 
ويمكن للخطة التي تستخدم لوزن المصطلحات في أنموذج الفضاء المتجهيء أن 
تكون موضوعية (كتردد المصطلحات مثلا) أو ذاتية أي غير موضوعية (كإدراك 
المستفيد أو فهمه مثلا». وطرق الوزن التي عالجناها في القسم 5/ /١‏ 7/ ؟ قابلة نظريا 
للتطبيق في تحديد الأوزان للمصطلحات في متجه ما. ولكل خوارزمية للوزن مزاياها 
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وعيوها. وقد ناقشن كورفيج (1997) 101386 الطريقة القائمة على تردد 
المصطلحات تفصيلاء وكذلك الطريقة القائمة على إدراك المستفيد» بالنسبة لتحديد 


الأوزان للمصطلحات في متجه ما. 

ويتساوى عدد الأبعاد في متجه استفسار أو وثيقة ماء مع عدد المصطلحات 
المختلفة التي تمثل المادة. وتشكل جميع متجهات الاستفسار والوثيقة الفضاء متعدد 
الأبعاد. ومن ثم فإن المجموعة الكاملة لقيم المصطلحات في متجه ماء تدل على موقع 
الاستفسار أو الوثيقة ثيقة التي تمثلها في الفضاء (1997 ,1أ171111 عت كعصمل علءمقم6). 

ويعني إجراء بحث في نظام الفضاء المتجهي لاسترجاع المعلومات» مراجعة 
المسافة مبينة كزاوية» بين متجهي الاستفسار والوثيقة في الفضاء. ويوضح أنموذج 
الفضاء المتجهي أوجه التشابه بين الوثيقة والاستفسار (أو بين أي وثيقتين) بمقارنة 
أبعاذههما المقابلة» وبحساب مقاييس التشابه هذه؛ بوصفها معامل جيب التمام 0518© 
1 ف111. فإذا كان كل من الاستفسار والوثيقة حول موضوع مماثل» فإن الزاوية 
بين متجهيهما ينبغي أن تكون صغيرة» أما إذا كان الاستفسار والوثيقة حول 
موضوعات مختلفة» فإن الزاوية بين متجهيههما ينبغي أن تكون كبيرة (1997 وكأقعنآ). 
كذلك يمكن قياس أوجه التشابه بين الوثائق بالطريقة نفسها. 


مظاهر قوة أنموذج الفضاء المتجهي: 


يكفل أنموذج الفضاء المتجهي, كما ذهب سبارك جونز وولت عاءمقم5 
(1997) 71111614 كسة وعدمل» أساسا موحدا لمدى واسع من عمليات الاسترجاعء 


يشمل التكشيف. والتلقيم المرتد للصلاحية» وتصنيف الوثائق. وتتضح أوجه قوة 
هذا الأنموذج على أحسن وجه عندما تقارن بمظاهر قصور أنموذج المنطق البوليني. 
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أولاء لم يعد المستفيد بحاجة لأن يلم بالمنطق البوليني ويطبقه. عند إجراء . 
عمليات البحث في نظام استرجاع معلومات الفضاء المتجهي. إلا أن ما يتعين على 
المستفيد عمله هو أن يختار ببساطة عدة مصطلحات بناء على حاجته إلى المعلومات. 

ثانياء يمكن للمصطلحات أو المفاهيم التي يقع عليها الاختيار لتمثيل 
الاستفسار أو الوثيقة» أن توزن لبيان أهميتها النسبية في المتجه. فإذا كان الاستفسار أو 
الوثيقة ميتم على سبيل المثال» أساسا بقضية الأمن في المشابكة» فإنه يمكن تخصيص 
وزن مرتفع لطا "الأم * 2ط ووزن منخفض ل مصطلح "المشابكة . 
8م وعلى هذا النحو لن يعامل هذان المصطلحان بوصفههما متساويين في. 
الأهمية في المتجه» ومن ثم يمكن الخروج بتمثيل ملائم للاستفسار أو الوثيقة. 

الثاء ترتب مخرجات عمليات بحث الفضاء المتجهي طبقياء تبعا لتناقص 
الصلاحية» نظرا لأن الأنموذج يعبر عن التشابه أو العلاقة بين الوثائق, أو بين 
الاستفسار ووثيقة ما على مقياس (من ٠.٠‏ إلى 2٠.١‏ حيث ٠.١‏ هو الأوثق صلة)» 
على سبيل المثال» عوضا عن التقسيم الثنائي (أي إما على صلة وإما ليس على صلة) كما 
يتم في أنموذج المنطق البوليني. ومن ثم فإنه بإمكان المستفيد أن يراجع؛ على سبيل 
المثال» الوثائق العشر المتربعة على القمة دون غيرهاء وهو على يقين من أن البقية» أي 
النتائج التي لم يراجعهاء لا يمكن أن تكون أوثق صلة بالاستفسار من الوثائق العشر 
التي استعرضها. وواقع الأمر أن قدرة المستفيد على الحد من حجم مخرجات 
الاسترجاعء ترتفع بالمقارنة بأنموذج المنطق البوليني. وتقتصد المخرجات المرتبة 
طبقياء في وقت المستفيد وطاقته في عملية استرجاع المعلومات» نظرا لأنه ليس على 
المستفيد النظر في جميع الوثائق» التي تبلغ الآلاف في غالب الأحيان» قبل أن يقرر أي 
الوثائق أوثق صلة من غيرها. وبإمكان النظام اختيار وتقديم أكثر الوثائق صلاحية 
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رابعاء يشكل التلقيم المرتد للصلاحية حة تقئية تم تطبيقها في أنموذج الفضاء 

المتجهيء من أجل الارتفاع بمستوى أداء الاسترجاع. وبناء على الناتج الصالح الذي 
سبق استرجاعه؛ يمكن لنظام استرجاع المعلومات المعتمد على الفضاء المتجهيء أن 
يكون قادرا على تعديل متجبه الاستفسار تلقائياء وتقديم أكثر النتائج صلاحية 
للمستفيد. ويمكن للتلقيم المرتد الخاص بالصلاحية أن يتم دون تدخل المستفيد, ك| 
يمكن تكرار العملية عدة مرات وفقا للضرورة. ومن الممكن للمستفيد أن يفععل 
العملية في نظم استرجاع فنعلومات الإنترنت» وذلك ببساطة بالاتجاه نحو الخيار 
الموسوم بعبارة '”المزيد ما يشبه هذا كفطا ععلئا 3/106" '» أو "“المزيد من النتائج المائلة 
كالناوع “نقاتمرزة »3/10 ''» على سبيل المثال. 


وكا تبين لنا في هذه المناقشة» فإن أنموذج الفضاء المتجهي قد تغلب على بعض 
أوجه القصور المرتبطة بأنموذج المنطق البوليني. إلا أن أنموذج الفضاء المتجهي قد 
أدخل أيضا بعض المشكلات الجديدة في مجال استرجاع المعلومات. 


أوجه قصور أنموذج الفضاء المتجهي: 

أول أوجه قصور أنموذج الفضاء المتجهي هو افتراض الانفصال بين 
المصطلحات التي يتم اختيارها لوصف متجه ما. وعند النظر في أنموذج المنطق 
البوليني يتبين أن الأنموذج لا يمكن أن يعبر عن ضروب أخرى من العلاقات» خارج 
نطاق المنطق البوليني. إلا أن أنموذج الفضاء المتجهي لا يستطيع التعبير عن أي 
علاقة» با في ذلك العلاقات البولينية بين المصطلحات. وبالأحرى فإنه ينطوي على 
الافتراض بأن تكون المصطلحات التي تشكل الأساس بالنسبة للفضاء المتجهي 
متعامدة أو مستقلة عن بعضها البعض. ويبدو أن هذا الافتراض غير صحيح؛ فإذا 
كانت المصطلحات التي اختيرت لوصف متجه وثيقة ماء هي السيارات” 
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و“التصدير“ و“ الاستيراد' 7061:1تصة 920 0514ماع ,8111012001165 فكيف يمكن 
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أن نفترض أنه ليست ثمة علاقة على الإطلاق بين المصطلحات الواردة؟ وقد انتقد 
هذا القصور بشدة في أوساط أولئك الذين هتمون بالأنموذج. 

ومظهر القصور الثاني في أنموذج الفضاء المتجهي» هو صعوبة تحديد علاقات 
الترادف أو العلاقات النحوية صراحة» نظرا لغياب المعاملات البولينية ومعاملات 
التقارب. ولكي نكون أكثر تحديداء فإن الأنموذج لا يدعم المعاملات البولينية 
ومعاملات التقارب. ومن ثم فإن المعامل "أو" 018 لا يمكن أن يستعمل للدلالة 
على المترادفات (ك) في 240201165 +01 كترقه). ى) أن المعامل "مع" 71113 لا 
يمكن أن يستعمل لتكوين عبارات (كم في 721أذماء” 7591111 دوتأهمممقصة) في 
متجه ما. إلا أنه في عمليات البحث الفعلية» هناك دائ) ظروف تدعو الحاجة فيها إلى 
المترادفات أو العبارات» لتمثيل الاستفسارات أو الوثائق. ومن ثم فإنه من الصعب 
على المستفيد إجراء عمليات بحث بدون الإمكانيات البولينية» ومعامل التقارب في 
نظم استرجاع المعلومات القائمة على الفضاء المتجهي» عندما لا يكون قد تم التعبير 
عن علاقة الترادف والعلاقات النحوية بين المصطلحات. 

أما مظهر القصور الثالث لأنموذج الفضاء المتجهيء فيتصل بتقنيته في الوزن» 
التي يمكن أن تكون غير موضوعية ومعقدة؛ فعملية الوزن تكون غير موضوعية 
عندما يطلب من المستفيد تحديد أوزان للمصطلحات. وخصوصا مصطلحات 
الاستفسارء وذلك بناء على فهمه أو تقديره اللخاص. ومن المفترض في المستفيد أن 
يقدر الأهمية النسبية التي يمكن أن يحظى بها المصطلح في عملية البحثء ثم يحدد وزنا 
له. ولا مناص من الذاتية في ممارسة تلك العملية. ومن ناحية أخرى». يمكن للوزن أن 
يكون معقداء بحيث لا يمكن لأي خوارزمية للوزن أن تعمل بدون خللء كما أن 
العثور على أفضل خوارزمية لبيئة استرجاع معينة ليس بالمهمة السهلة. يضاف إلى 
رذلك؛ أن مراصد البيانات في نظم استرجاع المعلومات تتسم بالدينامية» نظرا لحاجتها 
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إلى التحديث المستمر. وهكذاء يمكن لأوزان المصطلحات أن تتغير تبعا لذلك» نظرا 
لأن المحددات التي تستند إليها طريقة الوزن (كتردد المصطلحات مثلا) قد تغيرت. 
وقد لخص كوالسكي (1997) 1كاةاة:1507 عددا من طرق التعامل مع مراصد 
البيانات التي تتغير ديناميكياء وما لها من تأثير على خوارزميات الوزن. إلا أنه ى) أشار 
كز لكي شقن بس عن ور هنه لفاوق عا نكن أذ يتاي دوة مهن لكات 
(كالتكلفة مثلا). 

وإلى جانب أوجْه القصور الثلاثة التي تناولناها تواء يحتاج أنموذج الفضاء 
المتجهي أيضا إلى عدة مصطلحات لتمثيل استفسار ما أو وثيقة ماء حتى يمكن 
للمتجه أن يكون قادرا على التمييز بها فيه الكفاية» بالنسبة لآداء الاسترجاع المناسب. 
وفي مقابل ذلك» ' يمكن لمصطلحين فقط أو ثلاثة ترتبط بالمعامل ”و“ 4112 أن 
تكون كافية في بيئة بولينية» للحصول على مخرجات عالية الجودة* 5عص0ل عاءندقم8) 
(259 .2 ,1997 ,7111641 ©. ويمكن لتخصيص المزيد من المصطلحات,. في أنموذج 
الفضاء المتجهيء أن يؤدي إلى المزيد من التكلفة. وفضلا عن ذلكء يفتقر الأنموذج 
إلى التبرير النظري لبعض'عمليات معالجة المتجهات؛ فاختيار أسلوب بعينه لحساب 
تشابه المتجه في استعمال أنموذج استرجاع المعلوماتء على سبيل المثال لا يتقرر بناء 
على أي اعتبارات نظرية» وإنا يترك الأمر للمستفيد (1989 ,هغ521). 

وينبغي مثالياء أن يضع أنموذج الفضاء المتجهي» متجهات الوثائق على نحو 
يؤدي إلى تعنقد أو تجمع 54©768داله تلك الوثائق الصالحة لاستفسارات معينة معاء 
بين| يمكن لتلك الوثائق غير المرغوب فيها تزامنيا على الإطلاق. أن تبدو منفصلة في 
الفضاء (1975 وق ههلا عت 751058 ,ه0غ5[4). إلا أن مضاهاة استفسار ماء مقابل 
مجموعات أو عناقيد من الوثائق» المساة بالفرضية العنقودية كذوعط)مموط «عاكتا. 
لم تتسن بعد (1997 ,لأء9]111 عق دعدول علعمقمة). 
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وم يطبق أنموذج الفضاء المتجهي في كثير من نظم استرجاع المعلومات 
العاملة إلا بعد ظهور نظم استرجاع الإنترنت. ويتيح نظام سمارت 5844181 الذي 
يعد بمثابة حقل الاختبار» بالنسبة لهذا الأنموذج» فرصة النمو والنضج. ولقد أدى 
ابتكار أنموذج الفضاء المتجهي إلى إثراء البحث والتطوير في مجال استرجاع المعلومات 
إلى حل بعيد. 


أنموذج الاحتمالات: 

لقدأدخل مارون وكونز (1960) وصطتاكة 200 مم31 أنموذج 
الاحتمالات» الذي تطور فيا بعد على يدي روبر تصون وعدد آخر من الباحثين 
(1976 روعهه10 عاء لمك عت «وكاء100 على سبيل المشال). وكما ذهب سبارك 
جونز وولت (1997) ))»11!111 لسة كعممل علءمقم5: 


إن الأساس المنطقي لإدخال المفاهيم الاحتالية واضح؛ 
فنظم استرجاع المعلومات تتعامل مع اللغة الطبيعية» وهذه تفتقر 
إلى الدقة إلى حد بعيد» بحيث تكفل للنظام القدرة على أن يقرر 
أي الوثائق يمكن أن تكون صالحة» بالنسبة لاستفسار معين 
(وهذا موقف يتناقض بوضوح مع عمليات الاسترجاع غير 
الغامضة. اللازمة للبحث في نظم إدارة مراصد البيانات 
العددية). (259 .م) 


ويطبق هذا الأنموذج نظرية الاحتمالات» أي الحالة التي يحتمل حدوثها مسن 
صفر بالمئة إلى ٠٠١‏ بالمئة )١1.١ - ٠.٠(‏ لاسترجاع المعلومات. وهو يضع في الحسبان 
عنصر عدم التأكد في عملية استرجاع المعلومات» أي عدم التأكد فيما يتعلق ب إذا 
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كانت الوثائق المسترجعة بواسطة النظام» صا حة بالنسبة لاستفسار معين أم لا 
(1985 رص غ001 6). وبدف هذا الأنموذج إلى تقدير وحساب احنتمال أن تكون 
ونه امال لاطا ل ل عفن ارق . وتدل الحالة في هذا السياق 
الخاص باسترجاع المعلوماتء على احتمالات العلاقة بين الاستفسارات والوثائق. 
وعلى عكس الناذج الأخرى لاسترجاع المعلومات, لا يعامل أنموذج الاحتالات 
العلاقة بوصفها مقياسا دقيقا للاخفاق أو المضاهاة ع081:-:0-ووتدك وإنما ب* 
بو ِ يهالام وإسايثم 
التعبير عن العلاقة بناء على الاحتمالات. فمن الممكن على سبيل المثال للأنموذج أن 
يحيط مستفيدا ما علا بأن الوثيقة ”و“ احتالات ارتباطها بالاستفسار ”1“ 0" بالمئة. 
ويتبع هذا الأنموذج طرقا مختلفة لتحديد احتالات الارتباط بين 
الاستفسارات الوثائق. ويتم الحكم على الارتباط في أنموذج الاحتالات وفقا للتشابه 
بين الاستفسارات والوثائق. ويتوقف حكم الارتباط أيضا على تردد المصطلحات 
© سعناو؟ هدع). ويمكن القول بوجه عام, أنه كلما زاد التشابه القائم بين 
الاستفسارات والوثائق» زادت احتالات أن تكون تلك الوثائق صالحة بالنسبة 
للاستفسارات. ومن المفترض في النظام الاحتمالي لاسترجاع المعلومات. في التتائج 
التي يتم الحصول عليها بالنسبة لأي استفسارء أن تتكون من الوثائق التي تفي 
بشروط ذلك الاستفسارء باحتالات أعلى من حد معين (1997 ,505188286). 


مظاهر قوة الأنموذج الاحتمالي: 


بالمقارنة بأنموذج المنطق البوليني أو أنموذج الفضاء المتجهي» ب يتمتع أنموذج 
الاحتمالات بمظاهر القوة التالية: 


أولاء يكفل هذا الأنموذج ””دليلا مه للتقسيم الفئوي لعمليات الاسترجاعء 
فضلا عن التبرير النظري للممارسات التي كانت تنبع فيها مضىء على أساس تجريبي أو 
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خبر لهءأممه.كإدخال نظم معينة لوزن المصطلحات على سبيل المشال”* 
(348-349 .مم ,1989 ,581403). وتتسم عمليات الاسترجإع بدرجة من عدم 
التيقن» عند الحكم على مدى قوة العلاقة بين الاستفسارات والوثائق. وفضلا عن 
ذلك تتقرر العمليات الجوهرية للأنموذجء كقياس التشابه بين الاستفسارات 
والوثائق» بواسطة الأنموذج نفسه. بدلا من أن تتقرر ببعض القرارات التغسفية» كا 
في أنموذج الفضاء المتجهي. 

ثانياء يتضمن:الأنموذج علاقات تبعية المصطلحات وما يرتبط بها (أي أن 
حدوث واقعة مامن شأنه أن يؤدي إلى حدوث الأخرى في تطبيقات هذا 
الأنموذج). ولم يعد المستفيدون بحاجة لافتراض استقلال المصطلحات بعضههما عن 
بعضء كما كانوا في أنموذج الفضاء المتجهيء, وهو افتراض لا يحظى بالدعم في 
المارسة العملية. كذلك يزن هذا الأنموذج مصطلحات الاستفسارات والارتباط بين 
الاستفسارات والوثائق» وبذلك يتمكن المستفيدون من معرفة الأهمية النسبية 
للمصطلحات أو الارتباط» في مهمة الاسترجاع. كذلك يوفر هذا الأنموذج 
المخرجات المرتبة طبقياء نظرا لأنه يفترض أن تكون المهمة الأساس لنظام استرجاع 
المعلومات» هي ترتيب الوثائق التي تتكون منها المجموعة» وفقا لتناقص احتماللات 
الارتباط بحاجة المستفيد إلى المعلومات (1997 ,71111601 عت وعصمل عالءمفم6). 
ويسمى هذا الافتراض مبدأً الترتيب الطبقي للاحتالات. وبناء على مبدأ الترتيب 
الطبقي للاحتالات» يمكن للمستفيد أن يمارس قدرا من التحكم في حجم مخرجات 
الاسترجاع. ويتم التعبير عن كل من الوزن والترتيب الطبقي بالاحتالات. 

ثالثاء بإمكان هذا الأنموذج الإفادة من معلومات التلقيم المرتد» لتطوير طرق 
تستند إلى أساس متين (1985 ,8أ©0800151). وعلى النحو نفسه أشار كوالسكي 
(1997) فكطدلة120 إلى أنه من الممكن هذا الأنموذج أن يتحقق بدقة» من افتراضاته 
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رابعاء لا يستخدم أنموذج الاحتمالات في شكله الأصلي» إمكانيات المنطق 
البوليني» التي يمكن أن يجد المستفيدون صعوبة في تطبيقها. ومن ثم فإن نظم 
استرجاع المعلومات القائمة على أنموذج الاحتمالات» أكثر تعاطفا مع المستفيد» من 
نظم الاسترجاع القائمة على المنطق البوليني. 
مظاهر قصور أنموذج الاحتمالات: 

حظيت مظاهر قصور أنموذج الاحتالات بالدرس والتدقيق أيضاء من زوايا 
مختلفة منذ ابتكاره. وفيه| يلي نلخص هذه المظاهر بإيجاز. 

أولاء على الرغم من أن قيمة الصلاحية في هذا الأنموذج متواصلة» بدلا من 
التقسيم الثنائي صفر أو واحدء كما في الأنموذج البوليني» فإن أنموذج الاحتالات 
يفترض أن تتسم الصلاحية بالثنائية» أي أن: 

رم 21 -1 > رمدمن 181 

حيث (اع21 هو احتهال الصلاحية» ف (اءمدمم 201 هو احتهال عدم الصلا حية. 
وبعبارة أخرى فإن القيمة بالنسبة لاحتمال عدم الصلاحية ثابتة بمجرد خساب 
احتمالات الصلاحية» وبالتالي يتم استبعاد عامل عدم التيقن الجوهريء. من عملية 
استرجاع المعلومات. فك أشار روبرتصون (1977) «ه18006:5) فإن افتراض 
التقسيم الثنائي افتراض قويء ومن المؤكد تقريبا أنه غير صالح بوجه عام. 

ثانياء لا يمكن لأنموذج الاحتالات أن يؤدي إلى الارتفاع بمستوى فاعلية 
الاسترجاع.على نحو ملحوظ؛ فالنتائج التي أمكن الحصول عليها باستععال أنموذج 
الاحتهالات» وإن كانت جيدة: لم تكن أفضل بط فيه الكفاية» من تلك المسترجعة من 
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نظم المنطق البوليني أو نظم الفضاء المتجهي..ومن الممكن طبيعيا أن يثار تساؤل حول 
ضرورة وجود أنموذج إضافي لاسترجاع المعلومات, بينا لا يمكن لأذائه أن يكون 
مختلفا عن أداء النماذج القائمة. 

وبالإضافة إلى مظهري القصور الْلْذِين تناولناهما هناء يكتنف هذا الأنموذج 
مظاهر قصور أخرى؛ فالتمرس في الرياضيات» على سبيل المثال» لا غنى عنه للإحاطة 
باستعمال نظرية الاحتمالات» الأمر الذي يمكن أن يؤثر سلبا في سهولة التعامل مع 
الأنموذج. يضاف إلى ذلك أن هناك كثيرا من الأشكال المختلفة للأنموذج؛ فهناك 
بعض مظاهر الاختلاف حول أي الطرق هي الأفضل» وكيف يمكن حسم مختلف 
القضايا التقنية» حتى وإن كان هناك إجماع أو اتفاق حول الأنموذج العام 
(1985 ,سلعاوءاه800). وعلى نحو ممائل لأنموذج الفضاء المتجهيء كان أنموذج 
الاحتمالات» حتى ظهور نظم استرجاع الإنترنت» يستعمل للأغراض التجريبية» أكثر 
تما كان يطبق في النظم العاملة لاسترجاع المعلومات. 


امتدادات النماذج الرئيسة لاسترجاع المعلومات: 


عادة ما ينظر لكل من المنطق البوليني» والفضاء المتجهيء والاحتالات» 
بوصفها الناذج الثلاثة الرئيسة لاسترجاع المعلومات. ولكل من هذه النماذج 
امتداداته؛ فالمنطق البوليني الممتد» على سبيل المثال» امتداد لأنموذج المنطق البوليني 
وأنموذج الفضاء المتجهي مجتمعين. كذلك تستند الفئة الغامضة أو المشوشة 223ئا؟ 
56 إلى أنموذج المنطق البوليني» إلا أنها - فضلا عن ذلك- تدخل نظرية الفئات في 
استرجاع المعلومات. والتكشيف الدلالي الكامن 181684 من اشتقاقات أنموذج 
الفضاء المتجهي؛ إذ يدف إلى العثور على مجموعة أصغر حجما من الأبعاد والقيم؛ 
التي يمكن أن تستعمل بوصفها بديلا عن المصفوفة 8)53م الأصلية ,كاوع.1) 
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(1997. وترتب شبكة الاستد لال 2670116 ع26ءتاء دل وهي امتداد لأنموذج 
الاحتهالاتء الوثائق طبقياء وفقا لتراجع الاحتمالات» وبذلك يمكنها أن تفي بحاجة 
المستفيد من المعلومات, لا باحتمالات أن تكون المعلومات صالحة» كما في أنموذج 
الاحتالات الأساس (1997 ,)791116 عه معصمل علءسقم8). 

ومن الممكن أن نجد امتدادات إضافية للناذج الأساس لاسترجاع المعلومات» 
في التقسيم الهرمي لناذج استرجاع المعلومات» الذي طرحه كل من باييزا - بيتس 
وريريو - نتو (1999) 10ع11510-11 0صه 165ه-88622. وسوف نتناول بمزيد 
من التفصيلء اثنين من الامتدادات الشهيرة» وهما المنطق البوليني الممتد. ومجموعة 
الغموض أو التشويش. في القسمين التاليين. 
أنموذج المنطق البوليني الممتد: 

من عيوب أنموذج المنطق البوليني» كما سبق أن ذكرناء عدم تقبل أوزان 
المصطلحات. كما أن من مظاهر ضعف أنموذج الفضاء المتجهي عدم القدرة على 
التعبير عن العلاقات المنطقية البولينية. وقد تطور أنموذج المنطق البوليني الممتد 
لاستيعاب المصطلحات الموزونة» مع المحافظة على البنية البولينية. وعلى الرغم من أن 
بوكستاين 2أ©]800165 وآخرين قد أجروا أيضا بحوثاني هذا الموضوع 
(1978 رصأء)د»82001 على سبيل المثال) فإن هاري وو ]7 11813:9 هو من أدخل» 
تحت إشرافٍ جيرارد سالتون 521405 66850 أنموذج المنطق البوليني الممتد» بينا 
كان يكتب أطروحته (1981 ,ا و1983 ,1710 عق يزه1 ردهغ521). 

وفي أنموذج المنطق البوليني الممتد يتم تخصيص أو تحديد أوزان المصطلحات 
بناء على أي ربط بين المحددات التالية؛ وهي التقارب. والموقعء والترددء والصلة 
المتوقعة: وبفضل خاصية وزن المصطلحاتء يمكن للأنموذج أن يقدم محرجات مرتبة 
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طبقياء وبذلك يتخكم في عدد الوثائق المسترجعة. وفي الوقت نفسه تتم المحافظة على 
مزايا تكوين الاستفسار البوليني المنضبط. 

إلا أن أنموذج المنطق البوليني الممتد» لم يطبق على نطاق واسع في استرجاع 
المعلومات» نظرا للأسباب التالية: أولاء من الصعب تحديد أوزان الملصطلحات على 
نحو فعال ودقيق» نظرا للقضايا نفسها التي أوجزناها في القسم 7/ /٠‏ 27 في| يتعلق 
بأوجه قصور أنموذج الفضاء المتجهي. ثانياء يمكن للاستفسارات المتناظرة منطقياء 
أن تفشل في تقديم التتائج نفسهاء عندما يتم تحديد أوزان مختلفة لمصطلحات 
الاستفسار (1997 ,101386). وعادة ما يسترجع المصطلح ثقيل الوزن عددا كبيرا 
من الوثائق. إلا أن هذا الأنموذج يحاول التغلب على ما يكتنف أنموذجي المنطق 
البوليني والفضاء المتجهي من قصورء وذلك بالجمع بين مظاهر قوته|. وتدعم بعض 
نظم استرجاع الإنترنت (جوجل على سبيل المثال) البحث بالمنطق البوليني الممتد. 


أنموذج الفئات المشوشة: 

بهدف أنموذج الفئات المشوشة 564 تداق الذي اقترحه في البداية زاده 
(1965) 2206 إلى التغلب على أحد مظاهر قصور أنموذج المنطق البوليني (وهو 
عدم القدرة على التعبير عن الصلاحية الجزئية لتتائج البحث)» وذلك بتعميم نظرية 
الفئات التقليدية. ففي الفئة التقليدية» إما أن يكون المقصود أو.الهدف في الفئة أو ليس 
في الفئة. وكذلك الخال أيضا فإن الوثيقة إما أن تكون صالحة أو مزتبطة:» وإماغير 
صاحة بالنسبة لاستفسار معينء في النظام البوليني. ويعزل هذا الحد الفاصل أعضاء 
الفئة عن غير الأعضاءء أي الوثائق الصا حة عن الوثائق غير الصا حة. إلا أن مثل هذا 
الخط الفاصل لا وجود له تقريبا في استرجاع المعلومات. نظرا لأن النظام والمستفيد» 
لا يستطيعان في غالب الأحيان أن يحددا بدقة» ما إذا كانت الوثيقة صالحة لاستفسار 
بعينه أم لا (1997 ,ع160:488)» وإنما يمكن للصلاحية الجزئية أن تكون أكثر دقة في 
التعبير عن الحكم. 
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ويعرف مفهوم العضوية الجزئية- المقايل لفكرة الصلاحية الجزئية» اللازم 
للارتفاع بمستوى أنموذج المنطق البوليني- بنظرية الفئات المشوشة. ويفترض هذا 
الأنموذج أن تكون الوثائق والاستفسارات المشوشة لا وجود لماء إلا أنه من الممكن 
اح م 1 الور امار عد 
يتراوح بين *. ٠و‏ ١٠٠»ء‏ حيث يدل ٠ ٠‏ (الواحد الصحيح) على العضوية الكاملة. 
كن ولتي ال خا جزدا عنتقا دحا مضره بع ١‏ 


لا ا ا 0 
الحاصلين على مرتبة الشرف. ويمكن للانتقاء أن يتم بطريقتين؛ أولاهما اتباع نظرية 
الفئات التقليدية بتعريف “الطلبة المتفوقين'“ على وجه التحديد» بوصفهم أولنك 
الحاصلون على المعدل التراكمي 5.” فأكثر. ومن شأن أي طالب تنطبق عليه 
المواصفات أن يصبح عضوا في فئة الحاصلين على مرتبة الشرف. ولا يسمح لجميع 
الطلبة الحاصلين على معدل تراكمي أدنى من 77.4 أن يدخلوا أو يصبحوا أعضاء في 
هذه الفئة» حتى وإن كان من الممكن لبعضهم أن يكون حاصلا على معدل تراكمي 
4" وني مقابل ذلك. فإن الطريقة يقة الأخرى لانتقاء الطلبة المتفوقين لمرتبة تبة الشرف» 
تستخدم نظرية الفئات المشوشة» وذلك بتحديد درجة عضوية لكل طالب. ومن ثم 
فإن الطلبة المتفوقين يتم تحديدهم بدرجات العضوية التي يحصلون عليها؛ فأولئك 
الذين حصلوا على معدل تراكمي مقداره 4. يمكن منحهم درجة العضوية 2٠.١‏ 
بينما يحصل الطلبة الذين يبلغ معدهم التراكمي 5." فأقل على درجة عضوية تقترب 
من ٠.٠‏ أما الطلبة الحاصلون على معدل تراكمي في الوسطء وليكن 27.8 
فيحصلون على درجة عضوية ٠.8‏ على سبيل المثال. ومن ثم.ء فإن الطلبة الذين لم 
يحصلوا على معدل تراكمي 27.4 يمكن أن يظلوا ضمن فئة الطلبة المتفوقين» إذ تدل 
درجات عضويتهم على ارتباطهم بالفئة. 


259 


وفي تطبيق نظرية الفئات المشوشة في استرجاع المعلومات؛ يمكن الحكم على 
صلاحية الوثائق؛ بوصفها صالحة أو غير صالحة» فقط» كما يحدث في نظام المنطق 
البوليني» وعوضا عن ذلك يمكن تحديد درجة عضوية للوثائق للدلالة على مدى قوة 
انتمائها إلى فئة الوثاتق الصالحة. وتتقرر درجات العضوية بالنسبة للفئة المشوشة من 
الوثائق» من جانب المكشف في أثناء عملية التكشيف (1985 بصأءعؤىء6001. 

وتشمل مظاهر قوة أنموذج الفئات المشوشة التخفيف من حلة القيود 
الصارمة في أنموذج المنطق البوليني» أي أن تكون الوثائق إما صالحة للاستفسار وإما 
غير صالحة» دون السماح بالصلاحية الجزئية. وفي تحديد درجة العضوية يمكن لنظام 
الفئات المشوشة لاسترجاع المعلوماتء أن يوفر مخرجات مرتبة طبقياء وفقا لتناقص 
الصلاحية» بحيث يكون بإمكان المستفيد الاتجاه نحو النظر في التتائج المتريعة على 
القمة. وفضلا عن ذلك. فإنه تتم المحافظة على بنيان الاستفسار البوليني في 
الأنموذج, للتعبير عن العلاقات المنطقية. وتصلح النظم القائمة على أنموذج الفئئات 
المشوشة للاسترجاع الاستكشاني. 

بيد أن نظام استرجاع المعلومات القائم على الفئات المشوشة لا يتسم بالمرونة 
كا ينبغي» نظرا لأنه لا يحدد أوزانا لمصطلحات الاستفسارات في مقابل مصطلحات 
الوثائق. وهذاء فإن قيم استرجاع الوثائق تتوقف فقط على قيم مصطلحات الوثائق 
(1989 ,581408), وتتعلق هذه العبارة بتداعيات المحافظة على الإطار البوليني» في 
أنموذج الفئات المشوشة؛ ففي مثل عمليات البحث البولينية هذه التي تستعمل 
المعامل *”أو"* 0 (مثل أ أو ب أو ج) من المفترض في الوثيقة 21 المرتبطة بمصطلح 
استفسار واحد فقط (أي أ) أن تكون مهمة» شأنها في ذلك شأن الوثيقة 22 التي 
تشتمل على جميع مصطلحات الاستفسار (أي أء وبء وج). وما لا شك فيه أن قيمة 
أو صلاحية الوثيقة 11 يتم الحكم عليها بناء على مصطلح واحد فقط (أي أ) في هذه 
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بلا ناهر اتويات الابسار ريم وما اناقها شتت الابعتسارات 
التي تستعمل المعامل “و “ 3ه (مثل أو ب وج) فإن الوثيقة 21 التي تشتمل على 
جميع مصطلحات الاستفسار فيي| عدا واحد (أي أو ب) تعد بلا طائل» أي غير 
صالحة» شأنها في ذلك شأن الوثيقة 12 التي لا تشتمل على أي من مصطلحات 
الاستفسار على الإطلاق. 

وقضلا عن ذلكء فإنه بالمقارنة بأنموذج الفضاء المتجهيء فإن أنموذج الفئات 
المشوشة لا يوفر أي وسيلة للتعبير عن الاستفسارات. وفي مقابل أنموذج 
الاحتمالات» فإن أنموذج الفئات المشوشة أقل تماسكا من الناحية النظرية على الأقل. 
ولا يطبق هذا الأنموذج سوى في حالات متفرقة نادرة» في مجال استرجاع المعلومات. 


كما بينا في بداية هذا الفصلء فإن نماذج استرجاع المعلومات والامتدادات التي 
أوضحناها حتى الآن» ترتبط بالنظم في المقام الأول. وترتبط ناذج أخرى لاسترجاع 
المعلومات بمحددات مختلفة؛ فالأنموذج المعرفي» على سبيل المثال» يضع في الحسبان 
عامل المستفيد في استرجاع المعلومات» وسوف نتناول هذا الأنموذج في 
الفصل العاشر. 
مراجعة للنماذج الرئيسة لاسترجاع المعلومات: 

قدمنا في الأقسام السابقة معالجات سردية للناذج الثلاثة الرئيسة لاسترجاع 
المعلومات» وهي المنطق البوليني» والفضاء المتجهي» والاحتالات. وقد قصد 
بالجدول رقم ١/1‏ تلخيص بعض المخنصائص المهمة لحذه النماذج. 
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الجدول رقم ١/1‏ خصائص الناذج الثلاثة لاسترجاع المعلومات 





ونعيد النظر في النماذج الثلاثة الواردة في الجدول رقم 2١/1‏ من خمسة جوانب 
ا ا ا اا ا ا م ١‏ 
(7) هل ترتب المخرجات طبقيا؟ (5) أي معايير المضاهاة تطبق للتحقق من التشابه 
بين الااستفسارات والوثائق؟ (0) هل هناك خاصية فريدة؟ وتبين هذه الجوائنب 
الخمسة. إلى حد بعيد» مظاهر قوة ناذج استرجاع المعلومات ومواطن ضعفها. فتوافر 
إمكانية البحث البوليني» على سبيل المثال» تنيح للمستفيد القدرة على تكوين 
استفسارات محكمة. ومن ناحية أخرى» يمكن للخاصية نفسها (أي المنطق البوليني) 
أن تجعل نظام استرجاع المعلومات غير متعاطف مع المستفيد» نظرا للصعوبات التي 
ينطوي عليها إجراء عمليات البحث البوليئية. 

ويبدو أنموذج المنطق البوليني هو الأضعف من بين الناذج الثلاثة» الواردة في 
الجدول رقم 7/ ١؛‏ فهو لا يدعم سوى البحث البوليني فقطء و تتوقف المضاهاة على 
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وجود المصطلح في النظام. إلا أن هذا الأنموذج يستخدم بكثافة» ويطبق على نطاق 
واسع في استرجاع المعلومات. أما الأنموذجان الآخران فيبدوان متشابيين على 
السطح؛ إذ إنهماء في شكلهما الأصلي لا يشتملان على المنطق البولينيء إلا أنهه| يكفلان 
تقنيات الوزن والترتيب الطبقي. إلا أن المعايير التي تستخدم مسن جانب أنموذجي 
الفضاء المتجهي والاحتالات. لوزن المصطلحاتء وترتيب المخرجات طبقيا» وقياس 
التشابه» مختلفة. يضاف إلى ذلك أن تلقيم الصلاحية المرتد قد أضيف كإمكانية 
استرجاع فريدة في أنموذج الفضاء المتجهي. وقد بذلت جهود لاستعمال أي من 
أنموذجي الفضاء المتجهي والاحتالات. لتطوير نظم أفضل لاسترجاع المعلومات. 
إلا أن مثل هذه النظم لم تكن قادرة على أن تتفوق في أداتها. على النظم القائمة على 
أنموذج المنطق البوليني (1997 بعهقطتره؟1). 


نماذج استرجاع المعلومات في مقابل تقنيات الاسترجاع: 

قدمنا وناقشنا في الفصل الخامس مختلف تقنيات الاسترجاع, فا العلاقة إذن 
بين نماذج استرجاع المعلومات وتقنيات الاسترجاع؟ وبينا لا نجد هناك أي ارتباط 
دقيق» أو مباشر صريح بين الطرفين» فإن بعض تقنيات الاسترجاع ترتبط بوضوح 
باذج استرجاع المعلومات التي اشتقت منها؛ فالبحث البوليني» على سبيل المثال؛» 
تطبيق ولاشك لأنموذج المنطق البوليني. كذلك تحظى توسعة الاستفسارات» وتلقيم 
الصلاحية المرتد على وجه الخصوص.ء بالدعم من جانب أنموذج الفضاء المتجهي. 
ومن الممكن للبحث بالمصطلحات الموزونة أن يستند إلى خوارزميات تطورت في 
أنموذج الاحتمالات.ء أو أي ناذج أخرى لاسترجاع المعلومات» كالمنطق البوليني 
الممتدغل سبيل المثال. 

وإلى جانب تقنيات الاسترجاع تلك» ذات الأصول المعروفة بوضوح. تستند 
بقية التقنيات أيضا إلى ناذج استرجاع المعلومات؛ فالبحث بالتقارب على سبيل ال مثال» 


2063 


تمتد جذوره في الأنموذج البوليني الممتد. وفضلا عن ذلك. فإن تقنيات الاسترجاع 
ليس من الضروري أن تشجو تشتق من أنموذج استرجاع المعلومات نفسه الذي ينبغي أن 
يستخدم معها أثناء عملية البحث. ومن الممكن لكل من الناذج والتقنيات 
أن تستخدم جنبا إلى جنب» بصرف النظر عن مصادرها أو أصولاء إذا ما كان نظام 
استرجاع المعلومات قد صمم على هذا النحو. وواقع الأمر أن بناء نظم استرجاع 
المعلومات متعددة ؛الناذج ينبغي أن يحظلى بالتشجيعء »على التحوالمبين 
ف القسم ا" 

ويمكن للإحاطة بالعلاقة بين ناذج استرجاع المعلومات وتقنيات الاسترجاع 
أن تساعد في اختيار النظم المناسبة لمهام الاسترجاع. ومن بين الأمئلة الواضحة أن 
النظام البوليني يمكن أن يقع عليه الاختيار إذا كانت لدى المستفيد الرغية في إجراء 
عمليات البحث البوليني. وإذا كان الأمر يتطلب إجراء ببحث بناء على وزن 
المصطلحات. فإنه يتعين على المستفيد اختيار نظام لاسترجاع المعلومات» يستند إلى 
أنموذج الفضاء المتجهيء على سبيل المثال. 
في الطريق إلى نظم استرجاع المعلومات متعددة النماذج: 

لنماذج استرجاع المعلومات» كما تناولناها في هذا الفصلء مالها وما عليها. ومن 
ثم فإن نظم استرجاع المعلومات التي تطبق هذه الناذجء لا يمكنها سوى إنجاز مهام 
استرجاع معينة فقط. ولاستغلال مزايا ما لمختلف ناذج استرجاع المعلومات من 
مظاهر قوة» ينبغي بناء نظم استرجاع المعلومات بحيث تتضمن خصائص من نماذج 
استرجاع معلومات متعددة. وقد عبر فرانتس 188845 وآخرون عن فكرة ممائلة 
(1999 ,.1[ أء وقامة11). وإن كانوا يسمون النظم التي تتبع مبادئ متعددة 
لاسترجاع المعلومات "“النظم متعددة الطبعات كتاعاوتزد 15و 1]17نادط . 
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وتدل الممارسات الراهنة في مجال استرجاع المعلومات. على أن المنطق البوليني 
هو الأنموذج الوحيد الذي يطبق في جميع نظم استرجاع المعلومات تقريباء بينما تطبق 
النماذج الأخرى تدريجيا في نظم كنظم استرجاع الإنترنت. ويمكن لاستفسارات 
المعلومات أن تكون بدائية جداء ى) يمكن أن تكون في غاية التطور. وينبغي لنظم 
استرجاع المعلومات اللازمة لمعالجة هذه الاستفسارات» أن تصمم تبعا لذلك» باتباع 
طرق متعددة النماذج. ونظم استرجاع المعلومات متعددة النماذج» في تزايد مستمر على 
الإنترنت» التي في سبيلها لأن تصبح منصة رئيسة لنظم استرجاع المعلومات. 

والقضية الأخيرة فيه يتعلق بنظم استرجاع المعلومات متعددة الناذج» هي 
كيف يمكن لمختلف ناذج استرجاع المعلومات أن تتكامل. ومن الممكن الاسترشاد 
بمشرؤعات مثل مؤتمرات استرجاع النصوص (ترك 350خ11) لدوعتماء8 16 
9»مع0021) في هذا الصدد. كذلك ينبغي أيضا التعرف على المستفقيد المستهدف 
من نظام استرجاع المعلومات. من أجل التحقق من احتياجاته المعلوماتية على نحو 
أفضل في هذا العصر الرقمي. 
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الفصل الثامن 
نظم استرجاع المعلومات 


يتم إنجاز مهام استرجاع المعلومات في إطار نظم استرجاع المعلومات. وقد 
تطورت أنواع مختلفة من نظم استرجاع المعلومات» منذ خمسينيات القرن العشرين» 
لتلبية فئات مختلفة من الاحتياجات المعلوماتية. ونظم الخط المباشرء ونظم 
الأسطوانات المكتنزة 612-18014. والفهارس المتاحة للجمهور على الخط المباشر 
(أوباك 024605)» ونظم استرجاع معلومات الإنترنت» هي الفئات الأربع الرئيسة 
لنظم استرجاع المعلومات» التي تخدم المستفيدين» بقدرات متفاوتة:؛ لتلبية طلباتهم 
المعلوماتية. ونتناول في هذا الفصل بالدرسء. كل نوع من النظم. لبيان مقوماتها 


نظم الخط المباشر: النظم الرائدة لاسترجاع المعلومات: 

غالبا ما يتم اختصار نظم انط المباشر 001186 لاست ر جاع المعلومات. التي 
تسمى أيضا نظم الخط المباشر المهنية» كنظم الخط المباشرء أو مراصد بيانات الخط 
الأخيرة. وهذه هي أول أنواع نظم استرجاع المعلومات. التي استخدمت تقنيات 
الحاسبات. وديالوج 8141.060 والمدلاين 1:1017 24151 مثالان لنظم الخط المباشر 
لاسترجاع المعلومات”. 


(#) الواقع أن ديالوج نظام مضيف 25056 ببيئ فرص التعامل مع مراصد بيانات متعددة على الخط 


المباشر. أما المدلاين فهو الشكل الذي اتخذه نظام تحليل الإنتاج الفكري الطبي (المدلرز 
25» عندما أتيح التعامل معه على الخط المباشر. (المترجم) 
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وتكفل نظم الخط المباشر للمستفيد» بمساعدة الحاسب وتقنيات الاتصالات 
بعيدة المدى» فرصة البحث في مراصد البيانات القائمة في أماكن نائية. وكانت النظم 
في البداية تدعم التعامل على دفعات 28أ55ع©170م 6261 فقط (أي أن طلب البحث 
لم يكن يعالج فورا بمجرد تقديمه؛» وإنا كان يعالج في] بعد» عندما يتجمع عدد معين 
من الطلبات)» ثم أدخلت فيما بعد مقومات التفاعل الفوري بين المستفيد والنظام. 
وقد مر تطور نظم الخط المباشر في ثلاث مراحل (1980 رعدكنا80): 

« دراسات الجدوى والمشروعات الريادية: خمسينيات القرن العشرين. 

. الإنتاج بمجتمعات محدودة من المستفيدين: ستينيات القرن العشرين. 

٠‏ خدمات استرجاع المعلومات الوطنية أو الدولية: من سبعينيات القرن 

العشرين حتى الوقت الحاضر. 

وقد قدم هان (1996) ط118 معالحة مستفيضة للرواد الذين شاركوا في تطوير 
نظم الخط المباشر. وتتبع بورن وهان (2003) 1122 3820 2تدناو8 تطورات نظم 
الخط المباشر بين عامى ١977‏ و1477. ففى أعقاب التطورات والتحسينات التى 
تحققت منذ خمسينيات القرن العشرين» أصبحت نظم الخط المباشر فئة متميزة من نظم 
استرجاع المعلومات» في العصر الرقمي. 
خصائص نظم الخط المباشر لاسترحاع المعلومات: 

لقد كانت نظم الخط المباشر تجمع في المقام الأول» المعلومات الوراقية وبععض 
المعلومات العددية قبل ثانينيات القرن العشرين» ثم أصبحت بعد ذلك تشمل 
معلومات النصوص الكاملة. وقل! ينظر إلى معلومات الوسائط المتعددة في هذا النوع 
من نظم الاسترجاع. وياتم اختيار المعلومات التني تتضمنها نظم الخط المباشرء 
وتنظيمها بواسطة اختصاصين (كالمكشفين مثلا). وتستعمل اللغات المقيدة بكثافة» 
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لأغراض تنظيم المعلومات واسترجاعهاء كا يحظى البحث بالكلمات المفتاحية بالدعم 
في الوقت نفسه. وكانت لغة الأوامر 540هصتعدمء هي القاعدة بالنسبة للمستفيدين» 
للتفاعل مع نظم الخط المباشرء إلى أن تم إدخال الاختيار من قوائم الخيارات, في 
ثهانينيات القرن العشرين. ثم بدأ استخدام واجهات التعامل التصويرية 1681طم78ع 
تدريجياء في تسعينيات القرن العشرين» وخصوصا عندما بدأت نظم الخط المباشر 
تستخدم العنكبوتية العالمية بوصفها منصة لها. 

وقد اتبعت فئات متغددة من تقنيات الاسترجاع. ونماذج استرجاع المعلومات» 
في نظم الخط المباشر. والتقنيات الأساس للاسترجاعء كالبحث البوليني» والبحث 
بمراعاة شكل احرف الأولء والبترءو البحث بالتقارب» والبحث با حقول, متاحة في 
جميع نظم الخط المباشر تقريبا. أما تقنيات الاسترجاع المتطورة» كالبحث الموزون» 
والبحث المشوش 100227» وتوسعة الاستفسارات» وإن كانت لا تحظى بالدعم في 
جميع نظم الخط المباشرء فإنها يمكن أن تتوافر في بعض التطبيقات. وواقع الأمر أن 
نظم الخط المباشر كانت. فيها قبل منتصف تسعينيات القرن العشرين» بمثابة بيئئات 
اختبار بالنسبة للبحث والتطوير في استرجاع المعلومات. كما كانت هذه النظم أيضا 
تقوم مقام نوافذ العرض بالنسبة لتقنيات استرجاع المعلومات. قبل ظهور نظم 
استرجاع الإنترنت؛ فقد كان ديالوج على سبيل المثال» يكفل المخرجات المرتبة طبقياء 
باستعمال الأمر 224771 في عام ١991"‏ (1993 ,طء85). 

وفضلا عن ذلكء يمكن النظر إلى نظم الخط المباشر بوصها مختبرات لاكتساب 
وتنمية مهارات استرجاع المعلومات» لعدة أسباب؛ أولها أن النظام يتم بناؤه بحيث 
يكفل المارسة والمعالجة المنضبطة. وهناك بعض نظم انط المباشر التي توفر مقومات 
خاصة (كملفات وورش عمل أونتاب ديالوج 011147 5141:006'5*) 


2# الاسم المختصر لبرمجيات التدريب على الخط المباثر عدناعه8 لصه وسنسند:1' عسظلم0. (المترجم) 
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للمساعدة في تدريب المستفيدين. ثانياء كانت نظم الخط المباشر تمثل النظم الإلكترونية 
الوحيدة لاسترجاع المعلومات المتاحة في ذلك الوقت. ثالشاء من الممكن اختبار 
وتجريب فئات متنوعة من مهارات الاسترجاع في نظم الخط المباشر. إلا أن السبب 
الرابع يأ في الجانب السلبي؛ فمن المفترض أن يحصل المستفيدون من نظم الخط 
المباشر حتم| على التدريبء قبل الإفادة من هذه النظم أو التعامل معها. فالنظام ليس 
حدسيا أو بدهياء ولا يمكن الإلمام به ببساطة بالتجربة والخطأ. ونتيجة لذلكء فإن 
المستفيدين النهاتيين» في البحث على الخط المباشر اختصاصيو معلومات بوجه عام؛ 
يقومون بدور وسطاء البحث,. بين النظام والمستفيد الذي يحتاج إلى المعلومات. 


نظم الخط المباشر واسترجاع المعلومات: 

من بين الأنواع الأربعة لنظم استرجاع المعلومات التي تحققنا منها ني هذا 
الفصلء تتمتع نظم الخط المباشر بأطول تاريخ» كما أن لما أقوى تأثير في استرجاع 
المعلومات. فهذه النظم ترسي ضمنيا المواصفات المعيارية التي تلتزم مها النظم 
الأخرى. وحيئ) يظهر نوع جديد من نظم استرجاع المعلومات. دائم| ما يقارنه 
المستفيدون المحتملون بنظم الخط المباشره ليروا إلى أي حد يمكن للوافد الجديد أن 
يعمل بكفاءة في المجال؛ فقد تناول نال-جاكوبوفيتز وتينوبير 00051]5ع21[-لطولا 
(1992) أممع1' 0صقة. على سبيل المثال بالدرس» جوانب زمن الاستجابة» 
والتغطية» والمحتوى, والتكلفة؛ في كل من طبعتي المستخلصات السيكو لوجية 
كأع3 4511 [ق801081ع252 والمستخلصات الاجتاعية لقعزعم1م1ء50 
15 على الأسطوانات المكتنزة وعلى الخط المباشر. وقارن هيلدرث 
(1988) 131144 الفهارس المتاحة للجمهور على الخط المباشر بنظم استرجاع 
المعلومات على الخط المباشر» واستكشف احتالات إدخبال خصائص نظم الخنط 
المباشرء في الفهارس المتاحة للجمهور على الخط المباشر. كذلك قارنت تشو 110© 
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(1998) نظم استرجاع الإنترنت بنظم الخط المباشرء في جوانب كبناء مراصد 
البيانات» وإمكانيات الببحث والأداء قِ الاسترجاعء وخيارات المخرجات» 
وجهد المستفيد. 


ويبدو أن نظم الخط المباشر قد أثبتت مكانتهاء بوصفها النظم التي يقاس 
عليهاء في استرجاع المعلومات. إلا أنه | سبق أن ذكرناء فإن نظم الخط المباشر» أبعد 
ما تكون عن الكمال؛ فالتكلفة المرتفعة» وغياب التعاطف مع المستفيد» من الخصائص 
التي غالبا ما ترتبط بهذه الفئة من النظم. ومن ناحية أخرىء فإن الدور الرائد الذي 
مضت به نظم الخط المباشرء في استر جاع المعلومات» يحظى أيضا بالتقدير على 
نطاق واسع. 


نظم الأسطوانات المكتنزة: وسط مختلف لنظم استرجاء المعلومات: 

نشأت نظم الأسطوانات المكتنزة عن تطبيق تقنيات هذه الأسطوانات في 
استرجاع المعلومات» وحققت إلى أبعد حد. جزءا نما صممت لتحقيقه في مجال 
استرجاع المعلومات» مسايرة لما حققت تقنيات العنكبوتية العالمية من نضج. ونتناول 
هذه النظم في هذا الفصل» من أجل استال صورة مشهد نظم استرجاع المعلومات» 
في المقام الآول. وعادة ما يتم البحث في نظم الأسطوانات المكتنزة محلياء إذ لا تعتمد 
هذه النظم على الاتصالات بعيدة المدىء للتعامل معها مالم تكن النظم متشابكة. 
وكان مرصد بيانات الإنتاج الفكري السيكولوجي '89301:11, الذي تتبناه مؤسسة 
سيلفر بلاتر 51176212415 مثالا لنظم الأسطوانات المكتنزة. 

ومن الممكن النظر إلى نظم الأسطوانات المكتنزة» على نحو ماء بوصفها نظم 
خط مباشر» على وسط الأسطوانات المكتنزة» نظرا لأن هذين النوعين من نظم 
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استرجاع المعلومات يتقاسان كثيرا من الخصائصء ولأن نظم الأسطوانات المكتنزة 
مصممة على غرار نظم الخط المباشر» على أكثر من نحو. وفضلا عن ذلك فإن نظم 
الأسطوانات المكتنزة لم تطبق على نطاق واسع. إلا في ثمانينيات القرن العشرين» عندما 
أصبحت نظم الخط المباشر بالغة التأثير في المجال فعلا. 

ولا تبدو هناك مراحل واضحة في تطور نظم الأسطوانات المكتنزة. ومن بين 
الأسباب الرئيسة هذه الظاهرة» أن هذه النظم لم تبدأ من الصفره وإنها نشأت بوصفها 
مزاوجة بين الأسطوانات المكتنزة الناشئة» ونظم الخط المباشر الناضجة؛ باستخدام 
الأولى كوسط اختزان جديد. ولهذا فإن الخصائص الفريدة لنظم الأسطوانات المكتنزة 
تتأثر إلى حد بعيد. بخصائص الأسطوانات المكتنزة كوسط. 


خصائص نظم الأسطوانات المكتنزة: 

لا تزال المعلومات الوراقية» والعددية أو الإحصائية» والنصوص الكاملة» هي 
مصادر المعلومات الغالبة» التي يتم تجهيزها في نظم الأسطوانات المكتنزة. إلا أن زيادة 
في طاقة اختزان معلومات الوسائط المتعددة» حدثت عندما أصبحت تقنيات 
الأسطوانات المكتنزة أكثر قدرة من نظم الخط المباشرء في معالجة مثل هذه الأنواع من 
المعلومات. ولا تزال نظم الأسطوانات المكتنزة متعددة الوسائط» هي المستخدمة في 
بعض الظروف (كالموسوعات على سبيل المثال). وتستخدم اللغات المقيدة لأغراض 
تنظيم المعلومات واسترجاعهاء مرتبطة باللغة الطبيعية. ولا يزال التدخل البشري 
كثيفاء في استرجاع معلومات الأسطوانات المكتنزة. وقلم| نجد لغة الأوامر في نظم 
الأسطوانات المكتنزة» إذ يطبق الاختيار من قوائم الخيارات في غالب الأحيان. وقد 
ظهرت واجهات التعامل التصويرية أول ما ظهرت في بيئة الأسطوانات المكتنزة» كا 
أن بعض النظم تتبع البنيان الفائق ع*داغعنؤوءملاط في تطبيقاتها. 
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وتحظى تقنيات الاسترجاع الرئيسة (كالبحث البوليني» والبحث بالتقارب على 
سبيل المثال) بالدعم في نظم الأسطوانات المكتنزة» أما إمكانيات البحث المتقدم 
(كالبحث بالوزن والترتيب الطبقي للمخرجات على سبيل المثال) فتطبق على نطاق 
محدود. وليس من غير المألؤف أن نجد أن نظاما واحدا بعينه» قد تم اختزانه على عدة 
اسطوانات مكتنزة» الأمر الذي يمكن أن يحول دون تطبيق بعض تقنيات الاسترجاع 
المتقدمة في النظام. 

وبفضل سعتها الاختزانية العالية» وحجمها المادي الصغير نسبياء فإن نظم 
الأسطوانات المكتنزة قابلة نظرياء للتعامل معها في أكثر من منصة واحدة ع!طها:همص, 
نظرا لإمكان استيعاب عدة أسطوانات لجميع المعلومات اللازمة في مرصد بيانات 
معين. إلا أن مرصد البيانات وحده. لا يمكن أن يعمل كنظام لاسترجاع المعلومات. 
ويتطلب تشغيل النظام تجهيزات خاصة. ومن ناحية أخرى. فإنه يمكن أن يكون من 
الأكثر ملاءمة بالنسبة للمستفيد» أن يبحث في نظم الأسطوانات المكتنزة» نظرا لأنها لا 
تعتمد على تقنيات الاتصالات بعيدة المدى في تشغيلها. وإجراء عمليات البحث في 
الأسطوانات المكتنزة أقل تكلفة» نظرا لأنها لا تتحمل رسوم الارتباط أو أي رسوم 
أخرى بمجرد شراء النظم وتركيبهاء ومن ثم فإنه يمكن للمستفيدين إجراء عمليات 
البحثء دون الاكتراث با إذا كانت دقات الساعة تصدر أصواتهاء ويمكنهم التركيز 
أكثر على البحث نفسه. 

والمستفيد النهائي لا الوسيط» هو من يقوم بإجراء معظم عمليات | للبحث في بيئة 
الأسطوانات المكتنزة. ومن بين أسباب ذلك أنه وفقا لسياسة الرسوم الثابتة» والتعامل 
غير المحدود, فإن نظم الأسطوانات المكتنزة لا تفرض عادة رسوما إضافية على المستفيد 
النهائي. أما السبب الثاني فهو أن واجهة تعامل نظم الأسطوانات المكتنزة» أكثر تعاطفا 
ومراعاة لظروف المستفيد. من نظم الخط المباشرء نتيجة لاستخدام قوائم الخيارات 
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والواجهات التصويرية. ثالثاء تحث نظم الأسطوانات المكتنزة» وتشجع على التصفح» 
نظرا لأن تكلفة الخط المباشر لا تشكل عبئا بالنسبة للمستفيد النهائي في هذه الحالة. وكما 
تبين لنا في الفصل السادسء فإن التصفح والبحث هما النهجان الرئيسان للاسترجاع؛ 
والأول هو المفضل في بعض الظروف. وبالمقارنة فإن التتصفح في جلسات الاسترجاع 
على الخط المباشر يبدو مرتفع التكلفة. 


إلا أن نظم الأسطوانات المكتنزة يكتنفها بعض القصور في التحديث. إذ 
ينطوي كل تحديث على إحلال الأسطوانات القائمة» الأمر الذي يحد على نحو 
ملحوظ من معدل تردد التحديث أو تكراره. وعادة ما يكون معدل تحديث نظم 
الأسطوانات المكتنزة فصليا أو نصف سنويء بين يمكن لتحديث ما يقابل هذه النظم 
من نظم الخط المباشر أن يتم أسبوعيا أو يومياء وربهما على نحو مستمر (كأخبار بردج 
للأسواق العالمية كاعغ1 112 777014 ع81108؛ على ديالوج 2141.060 على سبيل 
المثال). ويمكن لسرعة البحث في نظم الأسطوانات المكتنزة أن تكون مشكلة» 
وخصوصا عندما يكون النظام الواحد موزعا على عدة أسطوانات. كذلك.لا تكفل 
نظم الأسطوانات المكتنزة التعامل عن بعدء مالم تكن مرتبطة بشبكة. وتسهم كل 
أوجه القصور هذه في الاستعاضة عن تقنيات الأسطوانات المكتنزة بالعنكبوتية 
العالمية» في هذا النوع من نظم استرجاع المعلومات. 
نظم الأسطوانات المكتنزة واسترجاع المعلومات: ' 

لقد سدت نظم الأسطوانات المكتنزة بعض الثغرات. التي لا تغطيها نظم الخط 
المباشر» في استرجاع المعلوماتء. وذلك بالوصول إلى المستفيد النهائي» وتوفير 
خدمات الاسترجاع لأولئك الذين كان من الممكن لنظم الخط المباشر أن تكون 
بالنسبة لهم باهظة التكلفة» ومن الصعب التعامل معها. ولنسبة مئوية عالية من نظم 
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الأسطوانات المكتنزة طبعات مقابلة على الخط المباشر» على الرغم من أن تغطيتها 
وخصائصها قد لا تكون واحدة. 

ويتم تدريجيا الاستعاضة عن الأسطوانات المكتنزة كوسائط للاختزان» 
بالأسطوانات الرقمية متعذدة الاستخدامات (0©17) وعآولل عانغوومء؟ لماتواط 
وهي تقنية أسطوانات مكتنزة أكثر حداثة. واعتمادا على طبقتين على كل من سطحيهاء 
تتسع الأسطوانة الرقمية متعددة الاستخدامات لا يبلغ ١1‏ جيجا بايت من المعلومات 
البصرية أو السمعية» أو أي معلومات أخرى. وبالمقارنة فإن الأسطوانة المكتنزة ” 
الراهنة بالحجم المادي نفسه؛ تتسع لأقل من ٠١‏ ميجا بايت من المعلومات ‏ ©©1) 
(2005 ,)»188. ولما كانت الأسطوانات الرقمية متعددة الاستخدامات تمثل تقنية 
أكثر تطوراء فإها تحل محل الأسطوانات المكتنزة كوسائط لنظم استرجاع المعلومات 
القابلة للتعامل مع عدة منصات. من أجل المعلومات متعددة الوسائط. أما الوظائف 
الأخرى لنظم الأسطوانات المكتنزة» فتتكفل بها تدريجيا تقنيات العنكبوتية العالمية. 


الفهارس المتاحة للجمهور على الخط المباشر: الفهارس الإلكترونيية 
للمكتبات كنظم لاسترجاع المعلومات: 

الفهارس المتاحة للجمهور على الخط المباشر 084165)» فهارس تقليدية محملة على 
وسط مختلف (1984 ,معنهمعصذظل1312). وفيا قبل ثانينيات القرن العشرين» م يكن هناك 
سوى بعض الجهود الرائدة» كنظام التحكم في المكتبة تسعاوز5 امعادمن) ومدرطأنآ 
بجامعة ولاية أوهايو ونط01 06 أو “انم[] عأها5. إلا أنه منذ عام ١94‏ تم تركيب 
ناذج مبدئية» ونظم عاملة للفهارس المتاحة للجمهور على الخط المباشرء في عدد من 
المكتبات» ينمو باطراد (1985 ,51110:61). وهناك في أيامنا هذه قليل من المكتبات التي. 
لا يوجد بها فهرس متاح للجمهور على الخط المباشر ضمن نظمها. 
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والفهارس المتاحة للجمهور على الخط المباشر» سواء كانت قائمة بذاتها أو 
جزءا من نظام متكامل لميكنة المكتبات مثل هورايزون 11011208» من سرمي داينكس 
نه (1كماق. من نتائج ميكنة المكتبات. وقداتم تطوير الفهارس المتاحة للجمهور 
على الخط المباشرء في البداية بواسطة كل من المتعهدين وفرق العمل بالمكتبات. 
وقد توقف الخيار الأخير ولم يعد له وجود, عندما أصبح متعهدو نظم ميكنة 
المكتبات أكثر خيرة واستقراراً. وقد تغيرت واجهات التعامل مع الفهارس المتاحة 
للجمهور على الخط المباشر من لغة الأوامر إلى قوائم الخيارات» وتعبئة الناذج 
والتمثيلات التصويرية. 

وقد قسم هايلدرث (1984) 81114645 الفهارس المتاحة للجمهور على الخخنط 
المباشر إلى ثلاثة أجيال» ليرسم خريطة تاريخها الحديث. ى| يتكهن بتصميمها المحتمل 
في المستقبل. ويحاكي اليل الأول من هذه الفهارسء بشكل أو بآخرء نبج الفهارس 
البطاقية بالنسبة لمحتوى الملف, والتنظيمء والتعامل بالنشبة للبحث عن الأوعية 
المعروفة في المقام الأول. ويضيف الجيل الثاني للفهارس المتاحة للجمهور على الخط 
المباشر تعزيزات في نقاط الوصول الموضوعية؛ وإمكانيات البحث» وجوانب أخرى. 
وتشبه فهارس هذا الجيل نظم الخط المباشر من نواح ععدة. أما الجيل الثالث من 
الفهارس المتاحة للجمهور على الخط المباشر» وهو في طريقه الآن لأن يصبح حقيقة 
واقعة» فيجعل الفارق بين هذا النوع من الفهارسء ونظم الخط المباشر أقل وضوحاء 
وذلك بتوسعة مدى التعامل؛ فمن الممكن للمستفيد البحث في مراصد البيانات على 
الخط المباشرء والتعامل مع المصادر الأخرى عن طريق الفهرس المتاح للجمهور على 
الخط المباشر» الخاص بالمكتبة المحلية بالنسبة للمستفيد. كذلك تحققت أيضا بعضضن 
التعزيزات الأخرى (كالتكامل بين نمجى بحث النصوص واللغات الطبيعية واللغات 
المقيدة على سبيل المثال) تلك التعزيزات التي اقترحها هايلدرث )111145 عام 
64 لهذا الجيل من الفهارس» وأصبحت الآن حقيقة واقعة. 
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ويبدو أن ترقيم أجيال الفهارس المتاحة للجمهور على الخط المباشر» قد توقف 
عند الجيل الثالث» وعوضا عن ذلك تكتسب فهارس أخرى تتاح على الخط المباشرء 
تختلف عن تلك الفهارس الخاصة بالأجيال السابقة» أساء مختلفة كفهارس الجيل 
التالي وفهارس القرن الحادي والعشرين» على سبيل المثال ,1326118 ومقتصاءاصة) 
(2007 وتؤععامه]ة :1995 رطاء 11110 :2006 ,2806 :ع. وقد نشأت فهارس الجيل 
التالي نتيجة لتطويع تنظيم المعلومات واسترجاعها للبيئة الرقمية» وإدخال تقنيات 
استرجاع أثبتت كفاءتها (2006 رععة© يق هتمعصرآ ,مقدماءاصة على سبيل 
المثال». وعادة ما تصبح العنكبوتية العالمية المنصة؛ بالنسبة ل هذا الجيل من الفهارس 
المتاحة للجمهور على الخط المباشر» الأمر الذي يكفل تحقيق الخصائص المتنوعة التي 
توفرها العنكبوتية؛ فالفهارس من هذا النوع تكفل على سبيل المثال» للمستفيدين 
التفاعل مع النظام عن طريق متصفح العنكبوتية» وواجهة التعامل معها. ومن ثم فإن 
الحاجة لا تدعو لزيد من التعلم لبيئة الاسترجاع هذه بالنسبة لمن يفيدون من 
الفهارس المتاحة للجمهور على الخط المباشرء نظراً لتآلفهم فعلا معها. كذلك يمكن 
إنشاء روابط بالمصادر الأخرى (كالكتب الإلكترونية ومقالات الدوريات مثلا)؛ من 
تسجيلات الفهرس المتاح للجمهور على الخط المباشر»ء وذلك لأغراض التعامل 
السلسء بالإضافة إلى الحصول على رؤوس موضوعات بروابط فائقة» في نطاق 
الفهرس المتاح على الخط المباشر, من أجل تعديل عمليات البحث. 

ومن ناحية أخرى دخلت تقنيات الاسترجاع. التي تطورت خصيصا في نظم 
استرجاع الإنترنت» إلى الفهارس المتاحة على الخط المباشر» تلك الأساليب التي 
تتضمن التلقيم المرتد الخاص بالاتصال بالموضوع أو الصلاحية» وترتيب نتائج 
البحث طبقياء والارتقاء بمستوى البيئة الخاصة بالتصفح. ومراجعة هجاء 
استفسارات البحث. وغالبا ما يتم الاستشهاد بفهرس الخط المباشر الخاص بمكتبات 
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جامعة ولاية شهال كارولينا 02101128 1)ه]8 (ع10هامء /تصلع. تدعص طتا :وم 
وعسةط 11 165165م[] عأهاك الذي تم تشغيله عام 2٠٠١5‏ بوصفه مثالا للجيل 
التالي من الفهارس المتاحة للجمهور على الخط المباشر © ,238عصاط بسقساعاصة) 
(2007 ولعخ113:1 :2006 رععهو8. وينطوي هذا الجيل الجديد من الفهارس المتاحة 
على الخط المباشرء ولاشك. على تحسينات وتعزيزات لم تتوافر في أسلافه, إلا أن كثيرا 
عما تصور ملامحه هايلدرث (1995) 111101615 وماركي (2007) 'إء8/851, في قوائم 
توقعاتب|ء بالنسبة لمستقبل نظم الفهارس المتاحة على الخط المباشرء لم يتحقق بعد. 
خصائص الفهارس المتاحة للجمهور على الخط المباشر: 

تتحقق التغيرات والتطورات كلم انتقلت الفهارس المتاحة على الخط المباشر 
من جيل إلى آخر. إلا أن هناك خصائص معينة» تبدو فريدة بالنسبة لهذا النوع من 
الفهارس» بوصفها نوعا من نظم استرجاع المعلومات؛ فهذا الضرب من الفهارس 
يشتمل أولا على معلومات وراقية حول موارد المكتبات الخاصة بالمؤسسات مختلفة 
المستويات (المحلية» والإقليمية» والوطنية على سبيل المثال). وعلى الرغم من إنشاء 
فهرس واحد يتاح على الخط المباشر لمكتبة واحدة. في معظم الأحيان» هناك حالات 
أخرى يشتمل فيها فهرس واحد على بيانات موارد عدة مكتبات. وفي مقابل ذلك لا 
تقتصر الأنواع الثلاثة الأخرى من نظم استرجاع المعلومات. في تغطيتهاء على الوثائق 
المتوافرة في مؤسسة واحدة لا أكثر. 

ثانياء يمكن النظر إلى الفهارس المتاحة على الخط المباشر بوصفها امتدادا 
لتسجيلات الفهرسة التي تقرأ آليا قصنعهلهاق) عاطقلدء1 عصنطءة31 (مارك 
1 أو أي مواصفة ان للفهرسة) التي عادة ما يتم إعدادها بواسطة 
اختصاصبي المكتبات» باتباع مجموعة من القواعد والمواصفات المعيارية (كخطط 
التصنيف وقواعد الفهرسة على سبيل المثال) لمجتمع المستفيدين الذي تخدمه المكتبة. 
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ولا يمكن لمعالجة المعلومات في الأنواع الأخرى من نظم استرجاع المعلومات» اتباع 
قواعد توجيهية متطابقة» واضعين في الحسبان مستفيدين مستهدفين بعينهم؛ فديالوج 
111000 وحده» عل سبيل المثال» يتسع نظامه المضيف لمئنات من مراصد البيانات. 
ويمكن لكل مرصد للبيانات أن يتم بناؤه وصيانته باستخدام لغة مقيدة مختلفة". وفي 
الوقت الذي يمكن فيه تحديد معالم مجتمع المستفيدين من مكتبة ماء يبدو من الصعب 
التتحقق بوضوح ممن يمكن أن يفيد من نظام الخط المباشر» وناهيك عن نظم استرجاع 
الإنترنت. التى تبدو غير قابلة للحصرء دائمة التغير. 

ثالثاء تدعم الفهارس المتاحة للجمهور على الخط المباشرء الآن على الأقل؛ 
البحث بالحقل (كالمؤلف أو العنوان مثلا) والبحث بالكلمات المفتاحية» والبحث 
البوليني» على الرغم من أن المتعاملين مع المكتبات قلم| يستخدمون المقومات البولينية» 
للأسباب التي نوقشت في الفصول السابقة. ويشكل البحث عن وثيقة معروفة بعينها 
قطاعا لا يستهان به من إجمالمى عمليات البحث في الفهرس المتاح على الخنط المباشر» 
ويرجع ذلك جزثيا إلى أن الفهارس المتاحة على الخط المباشر» من المحتمل أن تغطي 
أوعية '”معروفة" بالنسبة للمستفيد, أكثر من نظم الخط المباشر. أما خصائص البحث 
المتقدم (كالبحث الموزون على شبيل المثال) فإنهما لا تنوافر عادة بالنسبة للفهارس 
المتاحة للجمهور على الخط المباشر» نظرا لأن أداء الاسترجاع المناسبء من الممكن أن 
يتحقق حتى باستخدام إمكانيات البحث الأساسء ويرجع الفضل في ذلك 
لمجموعات المكتبات المحددة تحديدا مناسبا. إلا أنه فيما يسمى الجيل التاللي من 
الفهارس المتاحة للجمهور على الخط المباشرء غالبا ما يحظى التلقيم المرتد الخاص 
بالصلاحية أو بالاتصال بالموضوعء بالدعم عن طريق مثل هذه الروابط الفائقة من 


(*) للتغا : على هذه المشكلة» وتيسير مهمة المستفيد» طور ديالوج لغة موحدة للتعامل مع متا 98 
مراصد البيانات» وهي لغة التحكم في المهام ع8 ناومهآ ادعغههن) طول. (المترجم) 
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قبيل ”النتائج الماثلة “. كذلك يمكن للمستفيدين أيضا البحث في حدود نتائجهم 
المسترجعة؛ للعثور على المزيد من الأوعية المحددة» الأمر الذي يعد إحدى الخواص 
التي أضيفت حديثا لهذا الجيل من نظم الفهارس المتاحة للجمهور على الخط المباشر. 
رابعاء يكفل كثير من فهارس الجحيل الراهن للفهارس المتاحة على الخط المباشر» 
الوصول إلى مصادر أخرىء بها في ذلك نظم الخط المباشر. وفي مقابل ذلك لا يمكن 
لنظم الخط المباشر كفالة مثل هذا الضرب من خدمات البوابات 268167783 نظرأ 
لطبيعتها الربحية. واعتمادا على زد ٠5.5*؛‏ المواصفة المعيارية الخاصة باسترجاع 
المعلومات من مصادر مختلفة» باستعمال واجهة تعامل موحدة. يمكن للمستفيدين 
البحث في فهارس أخرى متاحة للجمهور على الخط المباشر» في أماكن مختلفة. وكما 
أوضحنا في القسم 5/ /١‏ 7/ 4 فإن خدمة العنكبوتية للبحث والاسترجاع / عنتهء8 
(77غ51) عء لمعك طع11 عمف ماع18 والبحث والاستر جاع عن طريق العنوان 
الموحد للمصدر (51810) 1011آ 1715 عمعتماء ا لطاءروء5. يمكنههما معا أن يجلا محل 
زد 239.5٠‏ بكفالة مهام وظيفية مماثلة» ولكن بدرجة تعقد أقل (2003 رصه7 6.آ). 


خامساء يشجع تصميم الفهارس المتاحة للجمهور على الخط المباشر على 
التصفح, إذ يمكن لمستتخدمي هذه الفهارس ممارسة التصفح, عادة بنقاط الوصول 
كالمؤلف والعنوان مثلاء بينم| تقدم الأنواع الأخرى من نظم استرجاع المعلومات» 
النتائج مرتبة زمنيا أو وفقا للترتيب الطبقي للصلاحية أو الاتصال بال موضوع. 
والتصفح برقم الطلب في الفهارس المتاحة للجمهور على الخط المباشر» مفيد على وجه 
الخصوص بالنسبة للمستفيد» نظرا لأن ترتيب عرض النتائج» يشبه إلى حد بعيده 
الترتيب المادي لمجموعات المكتبات على الأرفف. ومن ثم فإن المستفيدين من 
الفهارس المتاحة على الخط المباشر تناح لحم فرصة العثشور على الأوعية المنصلة 
موضوعيا بجوار بعضها البعض على الأرففء قبل التوجه إلى الأرفف بأنفسهم. 


252 


غير أن الفهارس المتاحة للجمهور على الخط المباشر لا يزال من الصعب 
التعامل معهاء على الرغم من أن معظم هذه الفهارس ينتمي إلى الجيل الثالث. ويرجع 
بورجمان (1996 ,1986) 80180382 النتيجة النهائية هذه إلى تصميم هذه الفهارس 
الذي لم ينجح في استيعاب الدروس المستفادة من دراسات استرجاع المعلوفات» وإلى 
الفهم القاصر لسلوك البحث. ولا يزال افتراض قدرة المستفيدين» بلا تدريب» على 
التعامل مع الفهارس المتاحة للجمهور على الخط المباشر (1988 ,طا11110) مفتقرا 
فين :الآن إل اليكل اماس 


لقد أصبحت الفهارس المتاحة للجمهور على الخط المباشر درة التاج في نظم 
استرجاع المعلومات. فيها بين بدايات ثانينيات القرن العشرين وتسعينيات القرن 
نفسه. عندما كانت تقارن بالفهارس البطاقية» ونظم الخط المباشر» التي يتم التعامل 
معها مقابل رسوم. وتبدو صلاحية هذه الفهارس في تراجع مطرد. نتيجة لنشأة نظم 
استرجاع الإنترنت» وارتفاع مستوى كفاءتهباء من حيث القدرات الاسترجاعية 
وخوااة كروك لفقي ويعبر الإنتاج الفكري الذي صدر بعد العصر الذهبي 
للفهارس المتاحة للجمهور على الخنط المباشر» عن حاوف حقيقية بشأن وضعها 
الراهن وظروفها المستقبلية» بين جوجل ©0081)). نظام استرجاع الإنترنت الذي 
تنزايد شعبيته» لا يحكم سيطرته على البحث في العنكبوتية العالمية فحسبه وإنما 
يتوسع في خدماته أيضا إلى ما وراء ذلك (مثل جوجل للبحث عن الكتب 600816© 
طععةء5 8001 وجرجل العالم هاوطء5 00816©). ويبدو نجاح جوجل في البحث 
في العنكبوتية العالمية» بالإضافة إلى توسعه في نطاق نفوذ الفهارس المتاحة على الحخط 
المباشر» المصدر الرئيس لمثل هذه المخاوف (2007 وتعكل1123 :2006 رنسدكء 812 ). 


203 


الفهارس المتاحة للجمهور على الخط المباشر واسترجاع المعلومات: 

لقد أثير التساؤل حول ما إذا كانت الفهارس المتاحة للجمهور على الخنط 
المباشر» فهارس مكتبات أم نظم استرجاع معلومات على الخط المباشر» في الماضي 
(1985 ,طغ»11114). ويمكن للإجابة عن هذا التساؤل الآن, أن تكون الفهارس 
المتاحة على الخط المباشر نظم استرجاع معلومات بسماتها الخاصة؛ لقد كانت الفهارس 
المتاحة على الخط المباشر تساعد المستفيدين في العثور على الأوعية في مجموعات 
المكتبات» وتفيد من الؤظائف التي لم تتوافر في أسلافها من الفهارس البطاقية. وفضلا 
عن ذلك تقوم الفهارس المتاحة للجمهور على الخط المباشر مقام البوابات التي تفضي 
إلى النظم الأخرى لاسترجاع المعلومات» بتوفير مقومات الارتباط بها. ولما كانت 
المنفردات 125م22020872 هي الفئة الرئيسة لمجموعات المكتبات» فإن الفهارس 
المتاحة على الخط المباشر» هي أداة الاسترجاع الرئيسة» إن لم تكن الوحيدة للوصول 
إلى هذه المنفردات. وبدون الفهارس المتاحة على الخط المباشرء يمكن لمجموعات 
المكتبات أن يكون من الصعب الوصول إليها في هذا العصر الرقميء نظرا لأن الأنواع 
الأخرى من نظم استرجاع المعلومات لم تصمم خصيصا لذلك الهدف. 

لقد غيرت نشأة خدمة جوجل للبحث عن الكتب طعثتهء5 80016 ع[ع600)» 
كما سبق أن ذكرناء بل إنبا تحدت فعلا الدور المسيطر الذي تنهض به الفهارس المتاحة 
على الخط المباشرء في العثور على معلومات الكتب. وقد بدأت خذمة جوجل للبحث 
عن الكتب, التي كانت تسمى في البداية مطبوعات جوجل 25126 200816 عام. 
20, لصالح مجموعة من الناشرين (مثل ع71:08طتصهن) ,الءستاعداظ 
ووع 2 معفعقلطن) 01. 'جاأونء أندنا عط ,دوع 1[801925117)» وبعد شهرين 
امتدت لمكتبات في عدة مؤسسات (مثل رتقعقتطء111 01 وغلوضء جنصنا رلسة د11 
0 لطة ,0212050 ,لإتتةنتطارآ عتاطسظ علعول؟ . بع38), وذلك كمشروع 


284 


جوجل للمكتبات (20083 ,600816). ومنذ ذلك الحين وأعداد المشاركين في هذا 
المشروع في تزايد مطرد. والكتب التي يشملها هذا المشروع قابلة للبحث بعد رقمنتها. 
وفضلا عن ذلك تتوافر في خدمة جوجل للبحث عن الكتب» خواص كالربط 
بمراجعات الكتب 86916775 80016 والمصادر التي تستشهد بالكتب (كصفحات 
العنكبوتية العالمية) الخاصة بالكتاب الذي يتم البحث عنه. وما لاشك فيه أن خدمة 
جوجل للبحث عن الكتب» تيسر استرجاع معلومات الكتبء بنهج يختلئف عن 
طريقة الفهارس المتاحة على الخط المباشر. كذلك تدعو خدمة جوجل للبحث عن 
الكتب؛ إلى جانب نظامه الخاص بالبحث في العنكبوتية» الفهارس المتاحة على الخط 
المباشر» لأن تعيد النظر في موقفها ووظائفهاء وأدائها.في هذا العصر الرقمي لاسترجاع 
المعلومات (2006 رتصداءة1/1). 


نظم استرجاع الإنترنت: أحدث أعضاء أسرة نظم استرجاع المعلومات: 

يكفل النمو الأسيى للإنترنت» للمتعاملين معها القدرة على الوصول إلى كميات 
هائلة من المعلومات الرقمية» بصرف النظر عن الزمان والمكان. كذلك تتضح في 
الوقت نفسه. الحاجة إلى المزيد من نظم استرجاع المعلومات؛ من أجل استرجاع أي 
"إبر" بعينها من “كومة تبن“ الإنترنت. ومن ثم طور الأفراد والشركات» 
والمئؤسسات عددا كبيرا من نظم استرجاع الإنترنت» أو نظم استرجاع المعلومنات 
الخاصة بالإنترنتء. للتغلب على مشكلة تفجر المعلومات على الإنترنت. 

وىاهو معروفه فإن عبارةمحرك البحث في العنكبوتية طاعهقءو طعه 
عستودع. أو رك البحث عسذوهء طاعموءة يبساطة:؛ يبدو الاسم الأكثر شيوعا من 
نظم استرجاع الإنترنت» عند الإشارة إلى النظم الخاصة باسترجاع المعلومات من 
الإنترنت» إلا أن هذا الكتاب يستعمل المصطلح الأخير» نظرا لأن الأول يبدو ضيقا 
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جدا في معناه. فالعنكبوتية» أولاء أجد التطبيقات لا أكثرء حتى وإن كانت التطبيق 
المسيطر في الإنترنت. كما أن المعلومات المتداولة من جانب التطبيقات الأخرى» 
كبروتوكول نقل الملفات (0”18 تدخل أيضا في نطاق نظم استرجاع الإنترنت. وصن 
ثم فإن تسمية نظم استرجاع الإنترنت بمحركات البحث في العنكبوتية» يمكن أن 
تعني ضمنا أنها تتعامل مع المعلومات المتوافرة في العنكبوتية فقط» وتستبعد المعلومات 
الناشئة عن التطبيقات الأخرى للإنترنت. ثانياء لبعض تطبيقات الإنترنت مقومات 
البحث الخاصة بها (مثل أرشثى 4:16 بالنسبة لمعلومات بروتوكول نقل الملفات 
#12).؛ وإن كان كثير 8 التطبيقات قد توقف تدريجياء أو بدأ استعمال 
العنكبوتية كمنصة. ثالثاء يمكن لأدوات استرجاع الإنترنت أن تكون معتمدة على 
الأدلة 50 -027]ء011 (مثل ياهو!) أو معتمدة على البحث 0ع5ةط٠طء5هء5و‏ 
(مثل آلتافيستا 41837715]8): ومن ثمء فإنه قد يكون من غير الملائم الإشارة إلى نظم 
استرجاع الإنترنت المعتمدة على الأدلة» بوضفها محركات بحث في العنكبوتية؛ لأن 
البحث لم يكن يحظى بالدعم في تصميمها الأصلي. والمكون الخاص بالبحث المتاح 
الآن في كثير من نظم استرجاع الإنترنت المعتمدة على الأدلة» ناتج عن الاتحاد بين 
النوعين المختلفين من النظم» ى) سنوضح في بعد. 

وسوف نقدم في هذا الكتاب معلومات حول نظم استرجاع الإنترنت» أكثر 
من تلك التي نقدمها حول الأنواع الأخرى من نظم استرجاع:المعلومات». لسببين؛ 
أولهما أن نظم استرجاع الإنترنت أحدث من نظم أخرى أعضاء في أسرة نظم 
استرجاع المعلومات. والسبب الثاني أن النظم الأخرى قد تمت دراستها بعمق» من 
جانب كثير من الباحثين على مر السنين (كنظم الخط المباشر من جانب هارتر 
6 ,112161؟ و لارج. وتد»وهارتلٍ 9 و(ع11:ه1 ث ,0ع0ع1 رععهنا؟ 
وميدو» وبويس» وكرافت 1999 ,]1هتدكاآ ع ,ع©1803 ,141680077؛ وووكر وجيئز 
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9 ,ععصول بغ مععللة11؛ ونظم الأسطوانات المكتنزة كتداءع5354 /2©2-1801 
من جانب شودري 1999 ,20120012115 وراولي وسلاك ,كلءع518ك عت و1201 
7:؛ والفهارس المتاحة على الخط المباشر 8465©)» من جانب بوليو وبورجمان 
6 ,تقتطع :50 ع إلء [اتددء8؛ وهايلدرث 1985 رطاع81113). إلا أن نظم 
استرجاع الإنترنت, لم تحظ بعد بالمعالجة على نحو منهجي شامل. 


فئات نظم استرجاع الإنترنت: 

تتوافر نظم استرجاع الإنترنت» على الرغم من حداثة عهدهاء بأعداد ضخمة 
وفئات متنوعة. ولم يكن من الممكن إحصاء المتاح من نظم استرجاع الإنترنت المتاحة 
على الإنترنت» نظرا لأن هذه النظم بدأت تتزايد في منتتصف تسعينيات القرن 
العشرين. إلا أن التقسيم الفئوي لنظم استرجاع الإنترنت» بناء على ما يلي من معايير» 
يقصد به إلقاء نظرة شاملة على أحدث أعضاء أسرة استرجاع المعلومات. 
التصليف وفقا لنهج الاسترجاع: 

البحث والتصفح هما النهجان الرئيسان للاسترجاعء اللذان حظيا بالمعالجة في 
الفصل السادس. وعلى الإنترنت» تسمى نظم الاسترجاع القائمة على البحث 
بمحركات البحث (مثل التافيستا وجوجل) بينا تسمى نظم استرجاع المعلومات 
القائمة على التصفح بالأدلة (مثل ياهو!). وغالبا ما تسمى الأدلة أيضا بالفهارس. 
وتكفل محركات البحث للمستفيدين فرصة صياغة أو تكوين استفساراتهم الخاصة 
بالبحث. وفي مقابل ذلك تنظم الأدلة» وتقدم موارد الشبكة تحت فئات منظمة هرميا. 
وبإمكان من يستخدمون نظم استرجاع الإنترنت القائمة على الأدلة» العثور على 
المعلومات باتباع مساز محدد سلفاء أي هرم الفئات الذي يوضع للنظام. 
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وكا بيناني الفصل السادسء فإن لكل من البحث والتضفح كنهجين 
للاسترجاع؛ ما يكتنفه من قصور؛ فاستفسارات البحثء على سبيل المثال» من 
الصعب صياغتهاء إلا أنها لاغنى عنها في نظم استرجاع الإنترنت القائمة على 
البحث. وعلى المستفيدين من الإنترنت صياغة استفساراتهم» نظرا لأن اختصاصيي 
المعلومات لا يعملون عادة كوسطاء في هذه البيثة. وعلى النحو نفسه؛ يمكن لعدد 
النتائج المسترجعة من الإنترنت: بالنسبة لمعظم الموضوعات. أن يتجاوز ببساطة 
الآلاف. إن لم يكن الملابين. إلا أن التصفح كنهج للاسترجاع.ء لا تتوافر له تقنية أو 
وسيلة لتضبيق استفسار الاسترجاع. ومن ثم, فإن نظم استرجاع الإنترنت تحاول 
التغلب عل مكل هذه الشكلات» يدعم كل من التصقم والببحت في الوقلت تقنسة. 
وتستخدم نظم استرجاع الإنترنتء القائمة على الأدلة» للسماح أو الترخيص 
لمحركات البحث بتوفير مقومات البحث على مواقعها. كذلك أيضا تعاقدت نظم 
استرجاع الإنترنت» القائمة على البحث؛ مع مرافق أو خدمات الأدلة لتوفير خيار 
التصفح في مواقعها. إلا أن الشراكات بين هذين الضربين من نظم استرجاع الإنترنت 
تتغير باستمرار» وأصبحت في نخهاية الأمر لا معنى لهاء عندما بدأ كبار الضالعين في هذا 
المجال» تطوير كل من محركات البحث والأدلة لنظمهم الخاصة في الوقت نفسه. 

ويسفر الجمع بين التصفح والبحث في أي من المواقع» عن النوع الثالث من 
نظم استرجاع الإنترنت. أي النظم الحجين لاسترجاع الإنترنت. وبإمكان المستفيد في 
بيئة الهجين هذه البحث أو التصفح في الموقع نفسه دون الانتقال إلى آخر. وقد ترتب 
على ذلك ارتفاع مستوى فاعلية الاسترجاع. 
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التصنيف تبعا للتطبيق: 

تطورت. منذ نشأة الإنترنت» الكثير من التطبيقات المختلفة: تلنت أعطاع]”» 
وبروتوكول نقل الملفات 1”112, والجوفر 805163؛ وندل المعلومات:واسعة المدى 
(و08415 56295 صمتأهد م/م وع2ه ع789710: والعنكبوتية أو العنكبوتية 
العالمية »78 75186 750014: وهذا قليل من كثير. ويقوم كل واحد من هذه 
التطبيقات بإنجاز مهام معينة؛ فتلنت» على سبيل المثال» للارتباط من مسافة نائية» من 
نظام. محلي» بحيث يمكن استغلال المقومات أو الموارد (كالعتاد والبرمجيات مثلا) 
القائمة في الموقع النائي. أما بروتوكول نقل الملفات 817 فيستخدم من أجل نقل 
الملفات» فيا بين النظم النائية والنظم المحلية بسلاسة وبسرعة عالية. والعنكبوتية 
»5 هي أكبر مستودع للمعلومات على الإنترنت» نظرا لواجهة التعامل الخاصة بهاء 
التي تراعي ظروف المستفيدين أو تتعاطف معهمء فضلا عن خاصية الوسائط الفائقة. 
وكان الجوفر» كتطبيق عاطل اليوم؛ إذ حلت محله العنكبوتية تماماء مصم| لاختزان 
وإسترجاع المصادر على الإنترنت» اعتمادا على واجهة تعامل عبارة على قائمة خيارات 
فائقة. ومن ناحية أخرىء كانت ندل المعلومات واسعة المدى أداة بحث بالكلمات 
.المفتاحية في مصادر الإنترنت»ء متوافقة مع المواصفة المعيارية زد .4.5٠‏ وفي مرحلة 
أو أخرى.» كانت نظم الاسترجاع يتم بناؤها من أجل كل هذه التطبيقات؛ فيا عدا 
ندل المعلومات واسعة المدى 78815: نظرا لأن هذا التطبيق الأخير كان يتكون 
في حد ذاته:من تقنية للاسترجاع. ويشتمل الجدول رقم ١/8‏ على نظم الاسترجاع 
التي نشأت من أجل التطبيقات الرئيسة للإنترنت» بناء على :بجي الاسترجاع 
المختلفين 2 


(*) تلنت بروتوكول للشبكات» تطور عام 2١1479‏ يستخدم في الإنترنت أو الشبكات المحلية» لتوفير 
مقومات التواصل التفاعلي القائم على النصوصء ثنائي الاتجاه» اعتمادا على منفذ افتراضي. (المترجم) 

(**) للتعرف على مثل هذه التطبيقيات للإنترنت» الجاري منها والعاطل» يمكن الاطلاع على مقالة 
تصور واقع الإنترنت حتى منتصف تسعينيات القرن العشرين: حشمت قاسم. الونترنت 
ومستقيل خدمات المعلومات. دراسات عربية في المكتبات وعلم المعلومات»ع944547١.‏ ص- 
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الجدول رقم ١/8‏ تطبيقات الإنترنت وما يقابلها من نظم الاسترجاع 


ا 

د | سه | سا 

مس | ات | «مه ا 
لعتكبوتية العالمية .. آلتافيستا .. إلخ باشو رين 







)١(‏ 20عطعنال بقعتدممع17 (؟) واعبوعل بتعطامه 


وكا يتضح من الجدول رقم 8/ »١‏ فإن نظم استرجاع الإنترنت تشمل أكثر من 
جرد محركات للبحث في العتكبوتية. وعلى الرغم من أن كثيرا من نظم الاسترجاع 
الواردة في الجدول رقم // الم يعد لها وجود اليوم» فإنها كانت تنهض بدور متميز في 
استرجاع المعلومات من الإنترنت» وخصوصا قبل أن تتطور نظم استرجاع الإنترنت 
0 العنكبوتية. ولمزيد من التحديد, فإن الهايتلنت” 4عساء)1]2 كانت تقدم 
قائمة تضم كثيرا من مصادر التلنت عن طريق واجهة تعامل نصوص فائقة. كذلك 


حص 488-44. وأعيد نشر هذه المقالة في: حشمت قاسم. الاتصال العلمي في البيئة 
الإلكترونية. القاهرة. دار غريب» .7٠٠6‏ ص ص .5575-5٠7/‏ 

(*) الحايتلنت محاولة مبكرة لتصميم واجهة تعامل عامة» أو بسيطة على الأقل» تتعامل مع مختلف 
مصادر المعلومات المعتمدة على تلنتء التى كانت متاحة قبل العتكبوتية العالمية. وكانت 
الحايتلنت تكفل لمن يتعاملون معها واجهة تعامل تصويرية 1[1©» تنيح فرصة تصفح دليل 
المصادر القائمة على تلنت» والوصول إليها على نحو معياري نسبيا. (المترجم) 
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كانت تكفل عمليات الربط الآلي للمواقع الواردة في القائمة. أما آر شي" عتطم4 
الذي قام بتطويره ألن إمتيج 1050128 «واة» عندما كان طالبا في الدراسات العليا 
بجامعة ماجل 1166:3111 بكنداء فكان يقوم دوريا بمسح مضيفي بروتوكول نقل 
الملفات 818 مجهولي الاسم وتجميع المعلومات (كاسم المضيف, واسم الدليل» 
وحجم الملف على سبيل المثال) وذلك بالنسبة للملفات المتاحة في تلك النظم المضيفة. 
وكان بإمكان المستفيدين البحث في الملفات ” القابلة للنقل بواسطة بروتوكول نقل 
الملفات'' باسم المضيف. واسم الدليل» واسم الملف. وذلك باستخدام آر شي. وكان 
الجوفر يتمتع بشهرة كبيرة قبل أن تصبح العنكبوتية هي نجم التطبيقات على 
الإنترنت. ولم يعد هناك الآن وجود على الإنترنت» لنظم الاسترجاع التي صممت 
لمعلومات الجوفر» وهي فيرونيكا 5876700108»: وجاجهيد 1181620ل: وجواهر الجوفر 
دل6ل «عمطه6؛ إذ توارى الجوفر تماما من الإنترنت. أما فترة حياة ندل المعلومات 
واسعة المدى 70415 فكانت قصيرة نسبياء ويرجع ذلك جزئيا إلى واجهة التعامل 
الخاصة بهاء التي كانت تعتمد على لغة الأوامر» وكذلك ظهور نظم استرجاع 
الإنترنت القائمة على العنكبوتية. إلا أن واجهة التعامل الموحدة:» والمواصفة المعيارية 
زد 794.6٠‏ المستقلة عن المنصة» التي تم تطبيقها في ندل المعلومات واسعة المدى. 
كانت تستخدم في كثير من تطبيقات الاسترجاع الأخرى (كالفهارس المتاحة على 
الخط المباشر على سبيل المثال). 

وقد تم استيعاب قطاعات من مهام الاسترجاع التي كان يتم إنجازها من قبل 
بواسطة نظم لا تعتمد على العنكبوتية» كآرشي على سبيل المثال؛ في النظم القائمة على 
العنكبوتية. ولم تعد نظم الاسترجاع الأخرى غير القائمة على العنكبوتية (مثل 


(”) أداة لتكشيف أرشيفات بروتوكول نقل الملفات 7”17, تكفل للمتعاملين معها العثور على 
ملفات بعينها. وتعد بمثابة أول محرك للبحث في الإنترنت. (المترجم) 
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فيرونيكا قءف7»”0) متاحة الآن» نظرا لأن رسالتها الاسترجاعية قد تحققت. ومن 
الممكن أيضا استرجاع المعلومات» التي ترد من مثل هذه التطبيقات الخاصة 
بالإنترنت» مثل يوزنت 786864]** (بالنسبة للمناقشات التي تدور بين أطراف 
متعددة» حول موضوعات متعددة) والقوائم 11545[ (الخاصة بالمناقشات التي تدور بين 
طرف واحدء وأطراف متعددة حول موضوعات متتقاة) قابلة للاسترجاع أيضا عن 
طريق نظم الاسترجاع القائمة على العنكبوتية العامة (مشل جوجل في 
م».5.500816م82011: بالنسبة لمعلومات اليوزنت) أو نظم الاستر جاع المحددة 
(مثل 5اكذا/اعه.ع1) غ2 غعم.1316 بالنسبة لمعلومات القوائم). 


وقصارى القولء فإن نظم استرجاع الإنترنت في الوقت الراهن» تعتمد جميعها 
على العنكبوتية» أو تستخدم العنكبوتية كمنصة. وتغطي نظم الاسترجاع هذه 
المعلومات التي ترد من العنكبوتية» والتطبيقات الأخرى (مثل بروتوكول نقل الملفات 
17 ويوزنت 186864]) حتى وإن كانت العنكبوتية هي الآن أكبر مستودع 
للمعلومات على الإنترنت. 
التصنيف وفقا للمحتوى: 

من الممكن أيضا تقسيم نظم استرجاع الإنترنت إلى فئات» وفقا لمحتوى 
المعلومات التي تغطيها. فبعض هذه النظم يحرص على التغطية الشاملة (مثل جوجل) 
وذلك بتجميع المعلومات من مختلف المصادر والمجالات الموضوعية. وفي مقابل ذلك 
يمكن لنظم أخرى أن يتم بناؤها من أجل مجال واحد فقط بعينه. ومن أمثلة مثل هذه 
النظم بوابةالمواد التربوية كلولعء)212 لهصمتاهع نل «10 ودجسعناه0 
(82169923:.01:8ع1919397.11) بالنسبة للتربية. 


(*) يوزنت» نظام لا مركزي عالمي للمناقشات في الإنترنت» نشأت قكرته عام 141/4 وتطور فعلا 
عام الالمترجم) 
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وقد تطورت بعض نظم استرجاع الإنترنت إلى مرافىئ 0011815 , بامتداد تغطية 
المحتوى إلى خخارج نطاق المعلومات القابلة للبحث فيها. إلا أن البحث يظل هو البؤرة 
في المرافئ. والمرافئ الرأسية أو المتخصصة 500815 في مقابل ذلكء مرافئ تقتصر 
على قطاع رأسي (كالرعاية الصحية» أو التأمين» أو السيارات أو الصناعات الغذائية)؛ 
فالمجال أو القطاع أو السوق رأسيء لأنه يركز على نطاق ضيق نسبيا من السلع 
والخدمات» بين| السوق الأفقية هي تلك التي تهدف إلى إنتاج نطاق واسع من 
المنتتجات والخدمات (2007 ,18861 166). ويمكن القول بوجه عام, إنه من 
الممكن النظر إلى المرافئ بوصفها نظما عامة لاسترجاع الإنترنت. أما المرافئ الرأسية 
من ناحية أخرىء فنظم متخصصة لاسترجاع معلومات الإنترنت» موجهة نحو سوق 
رأسية. وكل من المرافئ والمرافئ الرأسية أو التخصصية» نظم هجين لاسترجاع 
معلومات الإنترنت» تدعم كلا من التصفح والبحث. 
وبالإضافة إلى ذلك» هناك نظم الاسترجاع المكرسة لاسترجاع أنواع بعينها من 
المعلومات على الإنترنت. فأر قام الهاتف عصمطم.07) “ءطصسسل8 عصمطط 
(ددمء."زء طسسسص على سبيل المثال» نظام يمكن أن يستخدم للحصول على العناوين 
البريدية وأرقام الهواتف. أما مابكويست (6053.]وعناو صقتط.؟77 +065 مهال 
تكثل عل سيل لكان للمسعيدين لباعة عوان شا ماسج جا تعريطة يقصياية 
تفاعلية لذلك العنوان. 
ويوضح هذا التصنيف الهرمي لنظم استرجاع الإنترنتء تنوع وقدرات نظم 
استرجاع المعلومات التي تطورت على مر السنين. وكما يبدو فإن نظم استرجاع 
الامرنيع عقة قت درت رايت احندك ىنا واب الما امه 
استرجاع المعلومات. 
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خصائص نظم استرجاع الإنترنت: 

م يتم تصميم نظم استرجاع الإنترنت» وخصوصا محركات وأدلة البحث في 
العنكبوتية» باستثناء وايز 787415 [ندل المعلومات واسعة المدى] بوصفها جزءا من 
جهود تطوير الإنترنت» وإنها نشأت هذه النظم بوصفها استدراكاء عندما كان 
المستفيدون من الإنترنت» وهم يواجهون كميات هائلة من المعلومات غير المجهزة» 
يفتقدون أي أداة لأغراض الاسترجاع؛ فآرشي 4:16 على سبيل المشال» قد تطور 
عندما كان المتعاملون مع بروتوكول نقل الملفات» يرغبون في معرفة ما إذا كانت أي 
مواقع مجهولة لبروتوكول نقل الملفات تستضيف المعلومات التي كانوا يحتاجون إليها. 
وقد صممت محركات وأدلة البحث في العنكبوتية» بعد أن واجه المستفيدون من 
العنكبوتية صعوبات متزايدة في العثور على ما كانوا يريدونه؛ بمجرد تتبع الروابط 
الفائقة الكامنة في مواقع العنكبوتية. ولو أن العنكبوتية برمتها عرملت بوصفها مكتبة» 
لكان من الممكن للموقف أن يكون قابلا للمقارنة بالحصول على يحموعات المكتبة» 
قبل إنشاء الفهرس الخاص ببها. وتختلف نظم استرجاع الإنترنت؛ عن الأنواع الأخرى 
لنظم استرجاع المعلومات, في عدة أوجه أخرى إضافية نناقشها في الأقسام التالية. 
التغطية والمعلومات المصدرية: 


تمر أي معلومات»ء قبل أن تدخل في نظم الخط المباشر أو الفهارس المتاحة على 
الخط المباشر» حتم| عبر التحرير والتحكيم أو أي إجراءات مراجعة مماثلة» لضمان 
جودتها. إلا أن هناك قليلا من تدابير ضبط الجودة في عملية إنتاج المعلومات على 
الإنترنت؛ فبإمكان أي إنسان وضع أي معلومات على الإنترنت» دون مراجعتها من 
منظور الجودة أو مدى الملاءمة. ويمكن للمعلومات من هذا النوع؛ أن تصبح 
المعلومات المصدرية بالنسبة لنظم استرجاع الإنترنت. 
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وتعتمد نظم استرجاع الإنترنت. في المقام الأول» على وسائل حصاد 
8 آلية» كالشواخص الآلية 505045. أو العناكب 50106175: أو الزواحف 
5 لتجميع المعلومات من الإنترنت. كذلك تكفل هذه النظم للبشر تقديم 
المعلومات حول مواقعهم الخاصة» وإن كانت المعلومات التي تقدم ذاتياء لا تشكل 
سوى نسبة ضئيلة من إجمالى المعلومات التي يتم تجميعها. وفيما عدا نظم استرجاع 
الإنترنت القائمة على الأدلة» فإنه يبدو من النادر أن نجد بشرا يختارون يدوياء 
معلومات من الإنترنت. وفي مقابل ذلك يتحمل اختصاصيو المعلومات مسئولية 
عملية تجميع البيانات في الأنواع الأخرى من بيئات الاسترجاع. 

وعندما يتم إرسال أو إطلاق الشخوص الآلية أو العناكبء أو ما شابه ذلك؛ 
لتجميع البيانات؛ فإنها ليست جميعها مصممة لاستنساخ محتوى المواقع كاملة؛ فآرشي 
عنطءمة على سبيل المثال» كان يستنسخ فقط معلومات الدليل الخاصة بمواقع 
بروتوكول نقل الملفات. وتلتقط بعض وسائل الحصاد الكلمات المثتين الأولى أو 
الأسطر العشرين الأولى» من كل موقع تقوم بزيارته. وتحصل وسائل أخرى على 
معلومات معينة فقط (كالعنوان» والرؤوس والروابط الفائقة على سبيل المثال) من 
المواقع. وبالإضافة إلى ذلكء. فإن لمواقع العنكبوتية؛ بوصفها أكبر مستودع 
للمعلومات على الإنترنت» هياكلها الفائقة المتشابكة. وقليل من نظم استرجاع 
الإنترنت» ما يقصد أو تتوافر له المصادر لجمع المعلومات من كل وثيقة مرتبطة برابطة 
فائقة؛ فمن الممكنء على سبيل المثال» للبعض أن يقرر استنساخ الوثائق بناء على 
مستوى معين واحد للروابط الفائقة» تاركا المعلومات على المستويات الأخرى دون 
مساس. ومن ثمء فإنه بالنسبة لمعظم المواقع» لا تشتمل نظم استرجاع الونترنت سوى 
على جزء فقط من معلوماتها الكاملة. 
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وبالإضافة إلى العاملين اللذين عرضنا لما تواء فإن لما يسمى العنكبوتية الخفية 
أو غير المرئية 1015116 تأثيرها على تغطية نظم استرجاع الإنترنت. وتدل العنكبوتية 
الخفية على تلك المكونات التي لا يمكن الوصول إليها بواسطة النظم العامة أو 
المشتركة لاسترجاع الإنترنت» نظرا لصيغ الملفات (مثل الصور الناشئة عن استخدام 
الحاسب 01 وإسعع قط 2160 "عمعع زعأ نا مطره©) أو الهياكل 56111413165 (مثل 
مراصد البيانات المحملة على العنكبوتية). ولم تكن ملفات صيغ الوثائق متعددة 
المنصات (21(1) غهدمعه1"0 غسمعددده120 16 قوط على الإنترنت» تحظى بالتغطيبة 
من جانب أي نظام لاسترجاع الإنترنت» حتى غير جوجل من ممارساته» في مطلع عام 
١‏ لكي يستوعب هذه الملفات. 

وبناء على دراسات أجراها لورانس وجايلز ,1998) 1165© 220 ع35626اق] 
(1999» فإن تغطية نظم استرجاع الإنترنت» بالنسبة للحجم المقدر للعنكبوتية القابل 
للتكشيف على الصعيد العام (أي 6٠١‏ مليون صفحة في فبراير عام )١149‏ قد 
تراجعت على نحو ملحوظء منذ ديسمبر عام 4817 ١؛‏ إذ لم يكن أي نظام يكشف أكثر 
من حوالي ١‏ بالمئة من الحجم المقدر للعنكبوتية القابلة للتكشيف على الصعيد العام. 
وفي عام ١917‏ كانت نسبة التغطية حوالي 7 بالمئة. وقد تم استخلاص النتائج 
النهاتية بعد أن فحص الباحثون ستة من نظم استرجاع الإنترنت. في إحدى 
الدراسات» وأحد عشر نظاما في أخرى» اعتمادا على استفسارات حقيقية» أجراها 
العاملون في معهد بحوث إن إي مسي 11180:*. وقد قدر آخرون (مثل ,أقدم5 


(*) إن إي سيء شركة يابانية عابرة للبحار» تقوم بتوريد خدمات ومنتجات تقنيات المعلومات 
والحلول الشبكية للمشروعات التجارية» ومتعهدي خدمات الاتصالات والأجهزة الحكومية» 
ومقرها الرئيس في ميناتو 3118840 أحد أحياء طوكيو باليابان. وكانت تعرف قبل عام ١4817‏ 
باسم شركة نيبون للكهرباء نوصدهصحدهن) عقتمعء11 «مدمللظ. (المترجم) 
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0 أن نظم استرجاع الإنترنت التي تتربع على القمة» لم تستطع تكشيف ما بين ٠١‏ 
إلى 5/ بالمئة من صفحات العنكبوتية. 

وأيا كانت التغطية الفعلية» فإن ما يبدو جلياء أن نظم استرجاع الإنترنت لا 
تستطيع سوى تجهيز نسبة متناقصة من معلومات الإنترنت» نظرا لأن الإنترنت تنمو 
أسيا. وتميز التغطية غير المكتملة للمعلومات» والممارسات غير الانتقائية للمعلومات 
المصدرية» نظم استرجاع الإنترنت» عم يقابلها في البينات الأخرى 
لاسترجاع المعلومات. 
تقنية التكشيف: 

خوارزميات التكشيف الآلي» القائمة على إحصاء تكرار الكلمات والمعايير 
المماثلة» هي الغالبة في تمارسات التكشيف. في إنشاء نظم استرجاع الإنترنت. ويتطلب 
الأمر تدخلا بشريا محدودا في عملية التكشيف. حتى وإن كانت بعض النظم (ياهو! 
على سبيل المثال) تجنح إلى تقسيم المعلومات التي تشملها مراصد بياناتهاء إلى فئات 
يدويا. ونادرا ما تستخدم اللغات المقيدة في تكشيف محتوى العنكبوتية؛ مراعاة 
لعوامل كالتكلفة» والفاعلية» وطبيعة المعلومات على الإنترنت. 

وهناك بعض المشروعات (مثل إنتيوت ]2 ع انكس أكلناءع 1.2 كسمتو ) 
' التي تستعمل لغات مقيدة لتنظيم مصادر الإنترنت. ومن الممكن العثور على قائمة 
بالمشروعات الماثلة في سابيرستاكس 5كخل09015]80)). وهو دليل افتراضي يعتمد على 
العنكبوتية؛ لكثير من المشروعات وثيقة الصلة بالمكتبات وعلم المعلومات 
(2001 مهقهىء3ك861). إلا أن هذه المشروعات. إذا أردنا الدقة والتحديد, إنما هي 
بمثابة فهارس متاحة على الخط المباشر» بالنسبة لمصادر الإنترنت» أكثر منها نظا 
لاسترجاع الإنترنت» نظرا لكثافة التدخل البشري فيها. 
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ويتم التحقق من حقول (كالمؤلف والعنوان وسنة النشر على سبيل المثشال) 
وتكشيفهاء عند بناء مراصد البيانات لنظم الخط المباشر ونظم الفهارس المتاحة على 
الخط المباشر. وفي مقابل ذلك لا تتكون نظم استرجاع الإنترنت من حقول بيانات 
بالمفهوم التقليدي» في مراصد بياناتباء خلاف الملفات الكشفية الخاصة بالكلمات 
المفتاحية والأماكن التي تقابلها في النظام» بلا حقول. ومن الممكن معاملة المعلومات 
المميزة 188860اء مثل ...<11116> <1016/> في لغة ترميز النصوص الفائقة 
(1111311): أو ..<166زم> <ع16زم/> في لغة الترميز القابلة للاتساع (51311) عل 
أقصى تقدير» بوصفها أشباه حقولٍ 1105 51851). نظرا لأنها لا يتم تحديدها بطريقة 
موحدة في أثناء عملية التكشيف. 

وقصارى القولء فإن تقنية التكشيف بالنسبة لنظم استرجاع الإنترنت» تختلف 
عن تلك الخاصة بالأنواع الأخرى لنظم استرجاع المعلومات» من حيث اتباع الأولى 
للنهج الآلي القائم على الكلمات المفتاحية:» ولا تكشّف مصادر الإنترزنت 
وَقها للجقول: 
مقومات البحث: 

بوصفها أحد أنواع نظم استرجاع المعلومات» تكفل نظم استرجاع الإنترنبت » 
جميع مقومات البحث المتوافرة في بيئات الاسترجاع الأخرى تقريبا. إلا أن هناك 
بعض الجوانب الفريدة بالنسبة لنظم استرجاع الإنترنت نناقشها في هذا السياق. 

فالبحث البوليني» المسلم به في غير نظم استرجاع الونترنت. لم يكن يحظى في| 
مضى بالدعم في كل نظام من نظم استرجاع الإنترنت. ومن ناحية أخرى كانت علامة 
زائد (+) تستعمل على نطاق واسع بديلا عن المعامل و(2/1ه» في السنوات المبكرة 
لنظم استرجاع الإنترنتء إلا أن هذا أمر مضلل» نظرا لأن علامة زائد تمثل الرمز 
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بالنسبة لمعامل أو 018 أو الحاصل 533 المنطقي» كم| بينا في القسم 7/ 7. وعلى الرغم 
من توقف هذا الشكل من المارسات. لتصبح علامة زائد رمرًا للوزن بالنسبة للبحث 
الموزونء فإن استعمال علامة زائد بوصفها معامل و(4101؛ يسبب الخلط أو التشويش 
بالنسبة للمستفيد النهائي» وخصوصا ذلك الذي لم يارس البحث البوليني من قبل. 

والبحث بالتقارب ضروري في استرجاع العبارات (إذا لم تكن معلومات 
مرصد البيانات مكشفة بالعبارات) فضلا عن تحديد المواقع النسبية لمصطلحات 
الاستفسار. وتتسم نظم الخط المباشر بالقوة» على وجه الخصوص. في دعم عمليات 
البحث بالتقارب. وفي مقابل ذلك لم يضبح البحث بالتقارب من الخصائص العامة 
لنظم استرجاع الإنترنت. ومن بين تلك النظم التي تدعم البحث بالتقارب على 
الإنترنت» يكفل القليل منها المدى الكامل لمعاملات التقاربء التي عادة ما تتوافر في 
نظم الخط المباشر والفهارس المتاحة على الخط المباشر. 

وفيا يتعلق بالبتر» والبحث بالحقل» والبحث بمراعاة شكل الحرف الأول؛ 
فإن نظم استرجاع الإنترنت تدعم هذه التقنيات على نطاق محدود. وبقدرات محدودة. 
وإذا أخذنا البتر كمثال» فإن نظم الاسترجاع الأخرى يمكنها أن تكون محددة جداء 
بتحديد عدد الأحرف التي يتم بترهاء على سبيل المثال. أما معظم نظم استرجاع 
الإنترنت فيمكنها تحقيق البتر الأيمن غير المحدود فقط. ولا يزال البتر الآلي هو الخيار 
الافتراضي 06881116 في بعض الحالات» الآمر الذي يسفر عن المزيد من التشويش في 
نتائج البحث. وكما ذكرنا في القسم 8/ 5/ ”/ ؟ فإنه ليس هناك سوى قليل من أشباه 
الحقول (مثل العنوان والمحدد الموحد لمكان المصدر ,آ1018) في نظم استرجاع 
الإنترنت» لأن مثل هذه النظم بلا حقول بالفعل. وليست هناك فرص كثيرة 
للمستفيد؛ لأن يحدد البحث بالحقل في نظم استرجاع الإنترنت. 
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ويظهر البحث الموزونء الذي قل) نجده في الأنواع الأخرى من نظم استرجاع 
المعلومات» ضمن رصيد مقومات البحث الخاصة بكثير من نظم استرجاع الإنترنت. 
وتستعمل علامة زائد (+) على نحو مطرد في نظم استرجاع الإنترنت بوصفها رمز 
الوزن الذي يضفي المزيد من الوزن على المصطلح المقصود. ويبدو أن البحث الموزون 
يتجاوز أو يتجاهل البحث البوليني على الإنترنت؟ ففي استفسار حول ”الضرائب 
والغرامة أو العقوبة“ 220506 1ه اها على سبيل المثال» فإنه عند تحديد الوزن 
ل إالههعم يمكن للنتائج أن تشتمل على مصطلح 22117عم فقطء بينا يتم تجاهل 
:18 كلية في عملية البحث. 

والبحث المشوش #متقاك؛ على الرغم من أنه ليس بالخاصية المشتركة للأنواع 
الأخرى من نظم استرجاع المعلومات» ينفذ أو يطبق في بعض نظم استرجاع الإنترنت؛ 
فإذا كان المرء يقصد على سبيل المثال» البحث عن شارع روزفلت عتتهع45 ألءوءو00خ1 
في خرائط ياهو!» فإنه يمكن لنظام استرجاع الإنترنت المتخصص في معلومات الخرائط» 
إذا ما حدث خطأ في هجاء عبارة شارع روزفلت عناه476 1200569614, أن يظل قادرا 
على إرشاد من يقوم بالبحث إلى المكان الصحيح. إذا ما توافرت الأجزاء الأخرى من 
العنوان (كالرمز البريدي مثلا) بشكل صحيح. وخاصية جوجل “هل قصدت: 5214 
....:3363 ناولل" التي تظهر بعد وقوع الخطأ المطبعي» عند إدخحال استفسار البحث» 
من تطبيقات البحث المشوش أيضا. 

والبحث في مراصد بيانات متعددة ليس بجديد بالنسبة لنظم الخط المباشر. 
فعادة ما توضع مراصد البيانات الملائمة لتنفيذ مثل هذه الأنواع من عمليات البحث» 
أو تدار في نظام مضيف واحد؛ فنظام ديالوج 21410602 على سبيل المثال» قادر على 
دعم البحث في مراصد بيانات متعددة» وذلك بضم عدة مئات من مراضد البيانات 
المتشابهبة من حيث البنيان. وفي حالة نظم استرجاع الإنترنت» يمكن لمصطلح البحث 
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في مراصد البيانات المتقاطعة قطلطاء 563 ع07055-0218085 أن يكون مصطلحا 
أكثر ملاءمة في هذا السياق؛ نظرا لأن كل نظام قائم بذاتهه مصمم على نحو مستقل» 
ومن ثم فإنها تختلف عن النظم الأخرى؛ فهذه النظم ليست مصممة كأقسام فرعية 
لكيان أكبر. وتسمى النظم التي يمكنها كفالة البحث في مراصد البيانات المتقاطعة؛ ما 
وراء محركات البحث وعضذعدء طءةء72»185 (مثل دو جبايل ع11مع270). أو ما وراء 
نظم الاسترجاع كددء)535 519781)ع:52121 لكي يكون الأمر متسقا مع المصطلحات 
المستعملة في هذا الكتاب. ويختلف عدد نظم الاسترجاع القائمة بذاتهاء التي يمكن لما 
وراء محرك البحث تغطيتهاء من محرك إلى آخر وعادة ما يكون العدد في حدود تتراوح 
بين ستة نظم واثني عشر نظاما. وعادة ما يعمل البحث بالكلمات المفتاحية المفردة على 
أحسن وجه. في مراصد البيانات المتقاطعة» نظرا لأن هناك أوجه اختلاف أكثشر من 
مظاهر التشابه في نَظّْم :هته مصطلحات البحث ومعانيهاء فيا بين نظم الاسترجاع 
القائمة بذاتها تلك. ويستبعد بعض ما وراء نظم الاسترجاع في الإنترنت المكررات 
قبل تقديم النتائج للمستفيد. 


والبحث القائم على المفهوم أو المعنى» لا على مضاهاة الكلمات المفتاحية» هو 
المفضل على وجه الخصوص على الإنترنت» نظرا لأنه حاسم في الارتفاع بمستوى أداء 
الاسترجاع. كا أن اللغات المقيدة لا تستعمل عادة في نظم استرجاع الإنترنت. وقد 
جرت عدة محاولات في هذا الصدد؛ فمن الممكن على سبيل المثال» لنظنام استرجاع 
المعلومات أن يولّد آليا قائمة بالمفاهيم» بناء على مصطلحات الاستفسارات التي يتم 
إدخالهاء ويمكن للمستفيد أن يختار منها؛ فإذا كان الاستفسار على سبيل المثال» 
”احجز رحلة“ )4118 2 0001 فإن النظام يقدم قائمة خيارات منسدلة» تشتمل على 
مفاهيم “كالسفر جوا“ [896) "له و“رحلة“ مغو مسار أو خط سير“ 
[83[6©101. وحينئذ يختار المستفيد مفهوما مقابلا (مثل '”السفر جوا“ [833 "ثة) 
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لكي يواصل عملية البحث الفعلي. وهناك مثال آخر يتصل يبيحث المفاهيم؛ يكفل 
للمستفيد القدرة على إجراء عمليات البحث دلاليا. وفي هذا التطبيق» لا يمكن لغياب 
كلمة ما من الوثيقة (”مترو الأنفاق“ (2+:طئاه مثلا) أن تستيعد احتال أن تكون 
الوثيقة صالحة موضوعيا أو مفاهيميا للاستفسار حول ”النقل العام“ عتاطنام 
على سبيل المثال. ويمكن القول على وجه التحديد. أن مثل هذه 
التطبيقات لا يمكن النظر إليها إلا بوصفها مجرد أشباه بحث مفاهيميء نظرا لأن 
تكشيفها لا يبدو قائم) على المفاهيم؛ وهذا من الشروط المسبقة للبحث المفاهيمي. 
وبالأحرى فإنه يتم رسم خريطة للمفاهيم بالكلمات المفتاحية في أثناء غمليات 
البحث. باستعمال أدوات معينة (قائمة بالمترادفات على سبيل المثال). وفي الأنواع 
الأخرى من نظم استرجاع المعلومات؛ يكاد استعمال اللغات المقيدة يكون هو 
القاعدة» حيث يحظى البحث بالمفاهيم بالدعم بوجه عام. وفضلا عن ذلك فإنه عادة 
ما يصبح التعامل مع نظم استرجاع الإنترنت» التي تدعم البحثء مقابل رسومء 
بمجرد أن تكمل اختبارها النهائي على الإنترنت. ويمكن أن تكون العنكبوتية 
الدلالية» التي نتناولها في القسم /١7‏ *» قادرة على أن تكفل البحث المفاهيمي بلا قيد 
ولاشرطء عندما يتم إنشاؤها. 

وبحث الأنداد (821) “عءم-0)-"اععم.» إحدى المخواص الجديدة في حقل 
استرجاع المعلومات» ويرتبط ارتباطا وثيقا بنهج التنقية التضامنية أو التعاونية 
ع1 عحكتأدع«مطج لام المتبع في التسويق التجاري. إذ يتم فحص الخلفيات 
التاريخية» والإشارات المرجعية الخاصة بالمستفيدين السابقين» عند تلقي استفسار 
جديد» من أجل اكتشاف المعلومات المرتبطة بالموضوع. وعندما ينضم المرء إلى شبكة 
الأنداد 25©) فإنه يتم بحث استفساره مقابل المواقع التبي زارها وأشار إليها من 
ينتمون إلى الشبكة المبدئية نفسها. ومن الممكن تكرار هذه العملية بتوسعة مجال 
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البحث؛ ليشمل شبكات الأنداد الإضافية التي ينتمي إليها هؤلاء. وقد تناول فستا 
(2001) هنوع*1؛ اعتمادا على باندانجو 88208280) وهو مشروع قامت بتنفيذه آي 
فايف الرقمية 018481 15 كمثال: 
يمكن ... لباندانجو أن يقر الارتباط بالملوضوع بفحص 
شبكة مشعة 80184188 من “من يسجلون الإشارات المرجعية 
65 . وبمجرد أن يقوم شخص ما بتحميل باندانجو 
50 وينضم إلى شبكة أنداد ماء فإنه يمكن لبحث ذلك 
الشخص بالكلات المفتاحية؛ أن يفحص الخلفيات التاريخية 
للعنكبوتية» والإشارات المرجعية لشبكة مبدثية بائة من يسجلون 
الإشارات. وحينئذ يمكن للتطبيق أن يبحث الخلفيات التاريخية 
لأولئك المئة على العنكبوتية» وجمع عشرة آلاف تمن يسجلون 
الإشارات» ويعيد ذلك مرة أخرى» بحيث يمكن للاستفسار 
المرور على صفحات العنكبوتية التي تمت زيارتها والإشارة إليها 
من جانب مليون شخص. (5.1) 1 
وبحث الأنداد لا مركزي» ويفيد من معلومات البحث الناشئة عن مستفيدين 
سابقين» بدلا من البحث في مرصد بيانات مركزي. ويمكن لقضايا معينة 
(كالخصوصية والأمن على سبيل المشال) أن تثار حتما نتيجة لبحث الأنداد على 
الإنترنت. إلا أن هذه القضايا لا تدخل في مجال اهتمام هذا الكتاب. كذلك يسمى 
بحث الأنداد بالرابط 28أ0ه0ط في بعض الوثائق (مثل 2000 ,5175131]2). ومن 
ناحية أخرى يمكن لحركة الجيل الثاني للعنكبوتية 2.0 886 أن تمل محل بحث 
الأنداد بخواص إضافية. ونستكشف تأثير تقنيات الجيل الثاني للعنكبوتية 2.0 ط6]آ» 
على نظم استرجاع المعلومات في القسم رقم 8/ 0. 
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تقنيات الترتيب الطبقي: 
: دخلت طرق الترتيب الطبقي 816128 في استرجاع معلومات الإنترنت» 
كجهد يهدف لمساعدة المستفيد في العثور على الإبر في كومة التبن» على نحو أكثر 
فاعلية. وتشمل الخنوارزميات التي عادة ما تطبق للترتيب الطبقيء لنتائج عمليات 
البحث في جميع بيئات استرجاع المعلومات» كما تناولناها في القسم 0/ /١‏ ”/ ؟» تردد 
المصطلحات» وتجاور المصطلحات. ومواقع المصطلحات. والتردد العكسي للوثائق. 
وبينم| ترتب هذه الخوارزميات نتائج عمليات البححث وفقا للخصائص الجوهريية 
للوثائق (تردد المصطلحات على سبيل المثال)» هناك طرق ترتيب طبقي جديدة» تركز 
على المخصائص الجوهرية الناشئة عن البشر عندما يصلوا إلى وثائق العنكبوتية 
المستهدفة» أو عندما ينشئون مواقعهم الخاصة. 
وتستند أول تقنية جديدة للترتيب الطبقيء التي كان لمؤسسي جوجل» سيرجي 
برين 8:15 56786 ولورنس بيج 28986 18716806 فضل الر يادةفيهاء على 
الروابط الراجعة ككلهتاءا52, أي الروابط التي تشير إلى الموققع المزمع استرجاعه 
(1998 ,عوه2 عت دن:8). وتفترض هذه التقنية المسماة بترتيب بيج الطبقي 
علهةخاءع79, أنه كلم| زاد عدد مرات الإشارة إلى الموقع من جانب مواقع أخرى» 
أصبح أكثر أهمية. وتبدو هذه التقنية مشابهة إلى حد بعيد لتحليل الاستشهادات 
المرجعية» إحدى الطرق الراسخة التي تستخدم ضمن أشياء أخرى. لتقييم جودة 
الوثائق التخصصية. وباستعارة بعض المصطلحات من تحليل الاستشهادات المرجعية» 
يمكننا تسمية الموقع الذي يشار إليه بالموقع المستشهد به بينما يصبح الموقع الذي يشير 
إلى الموقع المستشهد به الموقع المصدري» الذي يرد به الاستشهاد 5166 88ذأاأ. وبعبارة 
أخرى» طور جوجل طريقة لتحليل الروابط التي تشير إلى المواقع المستشهد بهباء 
وترتيب هذه المواقع طبقيا. واسم ترتيب بيج الطبقي 88861481 خوارزمية تلاعب 
بالكلمات؛ لأنه سمي باسم أحد واضعيه؛ وهو لورنس بيج» ويدل على المستهدف 
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بالترتيب الطبقي وهو صفحات العنكبوتية. وتوضع المحددات الأخرى كالعنوان» 
وأشكال الأحرفء. وتقارب المصطلحاتء وأهمية المواقع المصدرية التي ترد بها 
الاستشهادات. في الحسبان أيضاء في حساب الرتبة (1998 رعههط عق ه(ف:8). 


وقد تطورت خوارزمية الترتيب الطبقي الحديدة الثانية» التي تعرف بنهج 
الرواج أو الشيوع طاعةه0ممة 2:15 آناممم في دايركت هيت”) 11 أعععلط؛ التي 
أصبحت فيم| بعد جزءا من تيؤما”' 160538. ثم دخل تيؤما فيم| بعد في حوزة آسك 
دوت و0 01 4 وهو نظام آخر لاسترجاع الإنترنت. وترتب هذه 
الخوارزمية المواقع طبقيا بناء على عدد مرات زيارتها فعلا من جانب المستفيدين (ومن 
هنا جاءت كلمة التسديدة أقط في 1114 ]ع116). فإذا نظرنا إلى آلتافيستا 41]87715)8 
وما يناظره من محركات البحثء. بوصفها نظا لاستر جاع المعلومات» يتحكم فيها 
المؤلفون (أي أن صلاحية نتائج عمليات البحث أو اتصاها بالموضوعء تتقرر بناء على 
مدى مضاهاة الكلمات المفتاحية لمحتوى الوثيقة)» وإذا ما أسمينا ياهو! وما يناظره من 
أدلة نظا لاسترجاع المعلومات يتحكم فيها المحررون (أي أن المحررين يعشرون على 
المواقع ويفهرسونها بفحصها كلا على حدة). إذن فالتسديدة المباشرة 1114 1164 
تمثل نوعا ثالثا من طرق البحثء وهو نظم استرجاع المعلومات التي يتحكم فيها 
المستفيد» ويتوقف فيها الترتيب الطبقي لنتائج عمليات البحث على الخيارات التي 
يقرها المستفيدون أنفسهم (1998 ,57ع610معدق7). وكلما زاد عدد زيارات الموقع 
من جانب آخرين» يزداد الموقع رواجاء ويتحسن وضعه الطبقي. إلا أن هذه 
الخوارزمية على وجه الخصوصء لم تطبق على نطاق واسع. 


(”) كانت إحدى شركات محركات البحثء ومقرها بوسطون. (المترجم) 

(**) تيؤما محرك بحث في الإنترنت» تطور عام ١٠٠؟.‏ (المترجم) 

(**) آسك دوت كوم محرك بحث في العيكبوتية؛ تطور عام 1447. ويركز على الإجابة عن 
الأسئلة. (المترجم) 
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وتنطوي خوارزمية الترتيب الطبقي الثالثة على خطوتين؛ أولاهما ترتيب المواقع 
طبقياء باتباع طرق الترتيب الطبقي التقليدية كتردد الملصطلحات»؛ وتقارب 
المصطلحات. من أجل تحليل الروابط الفائقة» المتضمنة في الموقع والنص المحيط ببذه 
الروابط. والخطوة الثانية هي إعادة تدقيق هذه الروابط الفائقة باتباع طريقة الروابط 
الراجعة التي يستخدمها جوجل. وقد تطورت طريقة الترتيب الطبقي المسماة هيتس 
5 <راختيار موضوع النص الفائق الناجم عأمه؟ 0ععتالصط امع توءمبوط 
20 على يدي جون كلاينبر ج(1999) ع678 141610 «ول, عندما كان يعمل 
بمشروع آي بي إم 1181/1 كليفر +01:19/151. وهدف كليفر للتحقق من النوعين 
التاليين من مواقع العنكبوتية» وهما: )١(‏ الحجج 810]50114165» أي أفضل مصادر 
المعلومات حول موضوع معين» و(؟) الحواشي واناطء أي مجموعات روابط تلك 
المواقع. ويؤدي تكرار هاتين الخطوتين إلى العثور على نتائج البحث وتنقيتهاء تلذك 
التتائج التي تقدم في النهاية بوصفها صفحات الروابط الصا حة أو المتصلة بالموضوعء 
مقسمة إلى حواش وحجج. ويمكن للحواشي والحجج أن تحتل مراتب أعلى من 
المواقع العادية. وكليفر رسمياء أحد مشروعات بحوث آي بي إم. ولم يقدم حتى 
الآن سوى عمليات بحث وتقارير بحوث للعرضء أما خوارزمية هيتس 11115 
فترتبط ارتباطا تكامليا على نحو متزايد» بكثير من طرق الترتيب الطبقي في نظم 
استرجاع الإنترنت. 

وطريقة الروابط الراجعة» التي استخدمت أولا من جانب جوجلء ثم فيها بعد 
من جانب كثير من نظم استرجاع الإنترنت الأخرى» ليست جديدة في بيئة 
الاسترجاع على الخط المباشر؛ فقد صمم معهد المعلومات العلمية” عده؟ عاد ناوه1 


0( أصبح الآن ف حوزة شركة هووموط1' - 5مءادء ك1 واتسع نشاطه في مراصد بيانات 


الاستشهادات المرجعية؛ متمثلا في عنكبوتية المعرفة ع1680181608 08 «اءثالآء وعنكبوتية العلوم 
ععصع ك5 4ه طع718آ. (المتر جم) 
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(51) سمتأمسصدمكم]آ عتلغمعءك5 سلسلة من مراصد البيانات (مثل كشاف 
الاستشهاد المرجعي في العلوم 120 «5)ها1:) ععمءء8) منذ ستينيات القرن 
العشرين» وفقا لمبدأ الاستشهاد المرجعي””» إلا أن تكرار الاستشهاد المرجعي لم يكن 
يستخدم كمعيار للترتيب الطبقي لنتائج عمليات البحث في مراصهد بيانات 
الاستشهاد المرجعي. حتى تم إدخال الأمر “رتب طبقيا'“ 14101 من جانب ديالوج 
6 في عام 1147. أما طريقة التسديدات المباشرة 13115 ]516 للرواج» 
وخوارزمية تسديدات كلاينبرج 11115 58'6مأ16ك1» من ناحية أخرى» فليس 
هناك ما يقابلهم! في بيئات الاسترجاع الأخرى؛ حيث لا تزال طرق الترتيب الطبقي 
غير متوافرة على نطاق واسع. 

وبين|ا يمكن لطرق الترتيب الطبقي التقليدية أن تسفر عن مشكلات» كحشو 
5 الكليات (أي تكرار بعض الكليات المفتاحية عمداً للحصول على مرتبة 
أفضل)» أو لا تؤدي أي معنى يذكرء في مواقف مثل الدفع في مقابل المكانة «0؟ لهم 
4 <(أي ترتيب نتائج عمليات البحث طبقيا بناء على كم منايسدد من 
رسوم) فإن التقنيات الثلاث التي تناولناها هناء تفتح بعدا جديدا للترتيب الطبقي 
لمواقع العنكبوتية وتقييمها. إلا أنها يمكن أن تسفر عن المزيد من مظاهر التحيز 
في عملية الترتيب الطبقي؛ لأنه يمكن للمواقع الجديدة غير المرتبطة أن تواجه 
وقتا متزايد الصعوبة حتى تصبح بارزة في نظم الاسترجاع تلك © ععرع1271) 
(1999 روع1©. 


(7) لمزيد من المعلومات حول كشافات الاستشهاد المرجعيء راجع: حشمت قاسم. كشافات 
الاستشهاد المرجعي وإمكاناتها الاسترجاعية. المجلة العربية للمعلومات» مج 7.٠ع؟؛‏ يونيو 
وأعيد النشر في: حشمت قاسم. دراسات في علم المعلومات. ط؟. القاهرة» دار 
غريب» 665 ص ص م0 (المترجم) 
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وليست خوارزميات الترتيب الطبقي القائمة على الروابط» بمنأى عن إساءة 
الاستخدام والانتقادات. وتشمل التدابير الرامية إلى استغلال نبج الروابط الراجعة 
مزارع الروابط 19025 ع1«ثاء وصفحات المداخل 85 00013927. ومزارع 
الروابط مجموعات من الروابط التي تشير إلى أي صفحة أخرى في موقع معين» من 
أجل تعزيز إحصاء الروابط الراجعة لذلك الموقعء بينما صفحات المداخل عبارة عن 
صفحات عنكبوتية تتكون كاملة من روابط لتحقيق الهدف نفسه. ويمكن أن تستخدم 
طريقة التسديدات 11115 للتصدي جزئيا للمشكلات الناشئة عن مزارع الروابط 
وصفحات المداخل. 

وبسبب تلك الإجراءات التعسفية أيضاء يتم استعمال أكثر من مئتي إشارة (أي 
عوامل) في الترتيب الطبقي لنتائج عمليات البحث الخاصة باستفسار معين» من 
جانب جوجل (20088) 600816. وقد لا تستعمل نظم استرجاع الإنترنت 
الأخرنى» ذلك العدد الكبير من المعايير ى] يفعل جوجلء في الترتيب الطبقي لنتائج 
البحث. إلا أنه بعد التتحقق من هذه الأنواع من الإجراءات التعسفية» لم يعد بإمكان 
أي نظام لاسترجاع معلومات الإنترنت. الاعتماد على أي طريقة بعينها قائمة على 
الروابط لأغراض الترتيب الطبقي. 

وانتقادات الترتيب الطبقي القائم على الروابط» متعددة الجوانب بوجه عام؛ إذ 
يتم أولا احتساب كل رابطة بوصفها صوتا واحدا للصفحة المرتبطة» دون التمييز بين 
الروابط. ثانياء لا تبذل أي جهود للتحقق من مكان صفحة العنكبوتية التي تشير إليها 
الرابطة؛ فالرابطة بعنوان المشفعة عل سيل الال تعامل على النحو نفسه؛ الذي 
تعامل به الرابطة بعنوان البريد الإلكترونيٍ الخاص بمسئول العنكبوتية 089289513 
الذي يمكن أن يكون مسئولا عن تطبيق لغة ترميز النصوص الفائقة بالنسبة للصفحة 
فقطء وليس عن محتواها الفكري على الإطلاق. ثالثاء يتم احتساب الروابط الذاتية 
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ككلصذا-؟[ء5. والروابط المكررة» والروابط من مراصد البيانات المترابطة فيا بينهاء 
والمواقع التي تكرر مواقع قائمة 115و 05اندط فعلاء يتم احتساب كل هذه جميعا 
بوصفها مساوية للروابط العادية (2005 ,وك[1:6903100775). وتردد مثل هذه 
الانتقادات» وإلى حد بعيد» صدى تلك الانتقادات التي توجه للمؤشرات القائمة على 
الاستشهاد ا مرجعي» في القياسات الوراقية:؛ وقياسات النشاط العلمي 
كع اع ممم امع ك5. فدوافع الربط؛ شأها ف ذلك كأن أسيات اللاستشهاد المرجعي'*'. 
متعددة» ومعقدة» ومن الضعب التحقق منها نظرا لطبيعة أسلوب 

الربط (2005 ,11ط0)). وفضلا عن ذلك يرن مبارات وهنسنجر 3880 818186 
(1998) مععدنوصع11 أن الحواشي والحجج المرتبطة ارتباطا وثيقاء التي يتم اكتشافها 

يقة التسديدات 1111:5: قد لا تكبون حول الموضوع الأصلي. 

تعديل البحث: 

يحظى تعديل استفسارات أو صيغ الببحث. في نظم الاسنترجاع على الخنط 
المباشر بالدعم المناسب؛ فبإمكان المسبتفيد توسعة أو تضييق عملية البحث بمختلف 
الطرق المتاحة في النظام (كالبتر أو البحث بالحقل على سبيل المثال). وبالمقارنة بنظم 
الخط المباشرء تبدو الفهارس المتاحة على الخط المباشرء أقل مرونة في تعديل صيغ 
البحثء على الرغم من تحسن الوضع في أجيالها التالية. يضاف إلى ذلك أن الحاجة إلى 
تعديل عمليات البحث في الفهارس المتاحة على الخط المباشر محدودة نسبيا؛ نظرا لأن 


(*)لمزيد من المعلومات حول علاقة الوثائق التى ترد بها الاستشهادات 5اسعصناء00 عععناوى 
والوئائق المستشهد مها 5اأتعمداء00 0أع)نل, راجع 1 
حشمت قاسم. تحليل الاستشهادات المرجعية وتطور القياسات الوراقية. المجلة العربية 
للمعلومات. مج”.ع5؛ ديسمير .١9١‏ ص ص .417-١١‏ وأعيد نشر هذه المقالة في: حشمت 
قاأسم. دراسات في علم المعلومات. ط؟. القاهرة» دار غريب» 6065 ص ص 1407-117. 
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البحث عن أوعية معروفة يشكل نسبة لا يستهان بها من إجمالي عمليات البحث في 
الفهارس المتاحة على الخط المباشر. 

وفي مقابل ذلك» فإن عمليات البحث في الإنترنت عادة ما تتطلب تعديلاء 
نظرا للكميات الضخمة من النتائج التي تسفر عنها عمليات البحثء وما يكتنف 
السماح للمستفيد النهائي بصياغة استفسار محكم من صعوبات؛ لأنه أولا لا يبدو من 
السهل بالنسبة للمستفيدين تعديل عمليات بحثهم؛ فليست هناك أولا فئات يتم 
إنشاؤها واختزانها لكل عملية بحث. بين| يعد ذلك من الخنصائص المألوفة في نظم 
الخط المباشر. ثانياء لا تتوافر سوى طرق للتعديل المحدود, بالنسبة لإحكام عمليات 
البحث؛ فجوجلء على سبيل المثال» يكفل للمستفيدين إجراء المزيد من عمليات 
البحث. في حدود النتائج التي يتم استرجاعهاء بمجرد أن يتم الاسترجاع» وذلك عن 
طريق اللجوء إلى خيار ”البحث في حدود النتائج “. وذلك في الأساس هو ما يمكن 
للمستفيد الحصول عليه في نظم استرجاع الإنترنت الراهنة؛ فيهم| يتعلق بتعديل 
البحث. ولا تزال مرونة وتنوع خيارات تعديل عمليات البحثء التي تحظى بالدعم 
في بيئات الاستر جاع الأخرىء مفتقدة على الإنترنت. 

ولما كانت اللغات المقيدة لا تطبق بوجه عام في تجهيز معلومات الشبكات, فإن 
بعض النظم (مثل جيجا بلاست 31881254)):*, تحاول بناء على الاستفسار الذي 
يدخله المستفيد» اقتراح قائمة بالمصطلحات من أجل تعديل عمليات البحث. فعندما 
يتم على سبيل المثال» إدخال استفسار عن الزنبق أو الخزامى وهلاناة» يقدم جيجا 
بلاست المصطلحات التالية للمزيد من إحكام عملية البحث: وأصقام ,0ه12اه110 
طلناط «ثادط ,وستوى وأكثر من ذلك. وبإمكان المستفيد اختيار أني من 
المصطلحات الواردة في القائمة» لاستعماله في تعديل البحث. إلا أنه على الرغم من 


(*) محرك بحث في الإنترنت. منفتح المصدر. (المترجم) 
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توافر مثل هذه الخواص التي تطبق في يعض النظم» لا يزال من الصعب يمكان على 
المستفيدين من الإنترنت» تضييق عمليات البحث إلى المستوى المرغوب فيه. إلا أنه 
هناك كل من التلقيم المرتد الخاص بالصلاحية ءاع 12208 ع56ه169©, والطريقة 
الآلية لتوسعة عمليات البحثء في نظم مثل جوجل. وبإمكان المستفيد استدعاء 
التلقيم المرتد الخاص بالصلاحية» وذلك ببساطة بالنقر على الروابط الفائقة المسماة ب 
”الصفحات المثيلة'' أو "المزيد مثل هذا على سبيل المثال. وهناك في الوقت نفسه 
مجال للمخاوف بشأن مدى جدوى هذه الطريقة:؛ إذا ما كان المستفيد يشغر فعلا 
بالغرق في عدد نتائج عملية البحث التي استرجعها النظام. 


واجهة التعامل: 

عادة ما تكون لغة الأوامر والاختيار من قوائم الخيارات: هما طريقتا واجهة 
التعامل السائدتان في نسبة كبيرة من نظم الخط المباشر والفهارس المتاحة على الخط 
المباشر. ويفسر ذلك على الأقل لما كان لبعض نظم استرجاع المعلوماتء بالنسبة لغير 
تطبيقات العنكبوتية (مثل آرشى علأطء:ه وفيرونيكا 976108168) واجهات تعامل من 
أنواع انلق وعد كميع المتكورقة يننا رفيا للإنترنت. ومنصة مألوفة 
للتطبيقات الأخرى (كالبريد الإلكتروني مثلا) تميل جميع نظم استرجاع الإنترنت» لأن 
تكون لها واجهات تعامل مع العنكبوتية» وهي واجهات تصويرية فائقة البناء أو 
التنظيم. ويسهم هذا التوحيد في واجهات التعامل في تعاطف نظم استرجاع الإنترنت 
ككل مع المستفيدء وهي خاصية ليست جوهرية بالنسبة للأنواع الأخرى من نظم 
استرجاع المعلومات. 

وقصارى القول. فإن لنظم استرجاع الإنترنت» خواصها الفريدة في التغطية. 
والمعلومات المصدرية» والتكشيف. وإمكانيات البحث». وطرق الترتيب الطبقي» 
وتعديل البحثء وواجهات التعامل» وذلك عندما تقارن بنظم الخط المباشرء 
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والفهارس المتاحة على الخط المباشر. ويمكن للبحث عن المعلومات متعددة اللغات» 
متعددة الوسائط أن يميز أيضا نظم استرجاع الإنترنت عن الأنواع الأخرى من نظم 
استرجاع المعلومات. ونغطي ذلك الموضوع في الفصل التاسع "“استرجاع المعلومات 
الفريدة في المحتوى أو في الشكل" . 
أجيال نظم استرجاع الإنترنت: 

لقد تطورت نظم استرجاع الإنترنت» لتصبح عضوا جديدا في أسرة استرجاع 
المعلومات» ولتصبح لا غنى عنها بالنسبة لكثير من المستفيدين :2008 ,1'2110195) 
(2004 ,81100 > عتصتهظ ,5211085. وقد أدخلت الكثير من التعديلاات 
والتحسينات على هذه النظم منذ بدايتها. وعلى الرغم من حداثة عهدها في التطور 
مقارنة با يقابلهاء يمكن تقسيم نظم استرجاع الإنترنت إلى ثلاثة أجيال مختلفة: بناء 
على الخواص الواردة في الجدول رقم 8/ 7. 

ويدل الجيل الأول لنظم استرجاع الإنترنت, على مثل هذه النظم الرائدة مثل 

ياهو! وزواحف العنكبوتية ©0583181) 7765. فقد كانت المعلومات النصية هي النوع 
الرئيس للمعلومات التي كانت تجمعها تلك النظم. ولم يكن تجهيز المعلومات متعددة 
الوسائط يحظى باهتمام يذكرء عندما تم بناء هذا اليل من نظم استرجاع الإنترنت» إلى 
جانب عرض الصور الكامنة فعلا في الصفحات أو المواقع» جنبا إلى جنب مع 
المعلومات النصية التي يتم استرجاعها. وكانت الأدلة ومحركات البحث متميزة عن 
بعضها البعضء وكان كل نظام يكفل طريقة واحدة للاسترجاعء؛ سواء كانت التصفح 
أو البحث. وكانت هذه النظم تكشف بالكلمات المفتاحية» وتدعم كجيل أول» 
إمكانيات البحث الأساس (كالبحث البوليني» والبترء والبحث بالتقارب على سبيل 
المثال). ولم يكن تعديل البحث ممكنا في هذا الجيل من النظم. ولم تكن مخرجات 
عمليات البحث ترتب طبقياء إلا أنه كانت تتاح للمستفيدين فرصة اختيار شكل 
العرض (كالعنوان فقطء أو العنوان مع ملخص موجز على سبيل المثال) وكان بإمكان 
النظام عرض عدد النتائج ٠١ وأ١ ٠(‏ أو ٠”على‏ سبيل المثال) دون تجديد الشاشة. 
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الجدول رقم 8/ ١‏ أجيال نظم استرجاع الإنترنت 





وكان الجيل الثاني لنظم استرجاع الإنترنت أكبر على نحو ملحوظ من الجيل 
الأول. وكانت بعض النظم تمثل تحسينات على طبعاتها المبدثية (مثل ياهو!) بينما كانت 
نظم أخرى تمثل إضافات جديدة (مثل جوجل). ولم يكن عدد لا يستهان به من نظم 
الجيل الثاني يكفل خدمات استرجاع معلومات نصية فحسب. وإنن| كانت تساعد 
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أيضا في العثور على ملفات الصور ومقاطع الفيديو والتسجيلات السمعية والموسيقية 
إم بي ثري 3/153. إلا أن عملية الاسترجاع كانت محدودة» وتقتصر على مراصد 
البيانات أو الملفات التي تشتمل على نوع بعينه من معلومات الوسائط المتعددة. 
وبعبارة أخرى فإن المعلومات النصية ومعلومات الوسائط المتعددة كانت تجهز بمعزل 
عن بعضها البعض. في هذا الجيل من نظم استرجاع الإنترنت. وعلى الرغم من إدارتها 
بواسطة شركات مختلفة في بعض الحالات» كان نهجا التصفح والبحث يتوافران في 
الموقع ذاته» بحيث يمكن للمستفيد أن يختار من بين بجي الاسترجاع دون الانتقال 
إلى موقع آخر. وكان التكشيف لا يزال يعتمد على الكلمات المفتاحية؛ إلا أن بعض 
الجهود كانت تبذل لرسم خرائط المفاهيم في شكل كليات مفتاحية» باستخدام وسائل 
للبحث عن المفاهيم (راجع القسم 8/ 5/ 7/ 07). وبينما ظل البحث الأساس يحظى 
بالدعم من جانب الجيل الثاني لنظم استرجاع الإنترنت» فقد تم إدخال إمكانيات: 
بحث متقدمة (كالبحث الموزون على سبيل المثال). وتكفل معظم نظم استرجاع 
الإنترنت نوعين من إمكانيات البحث؛ )١(‏ البحث البسيظ» الذي يتضمن عمليات 
بحث خالية من الرموز أو الإشارات (كالمعاملات على سبيل المثال)؛ و(7) البحث 
المتقندم الذي يقبل الرموز والإشارات. وتستخدم نماذج 108535 البحث عادة 
لعمليات البحث المتقدم. وكان من الممكن توسعة عمليات البحث أو تضييقهاء بعدد 
محدود من الطرقء كالتحديد بالتاريخ» أو التحديد باللغة» أو البحث في حدود 
النتائج» أو بالتلقيم المرتد للصلاحية أو الاتصال بالموضوع. وكانت نتائج عمليات 
البحث ترتب طبقيا في معظم الأحيان» بناء على خوارزمية ترتيب طبقي» عادة ما كان 
يتم الاحتفاظ بمكوناتها طي الكتمان. وقد تراجعت خيارات عدد المخرجات» وشكل 
العرض تدريجيا في هذا الجيل من نظم استرجاع الإنترنت» نظرا لتراجع أهميتها بالنسبة 
للمستفيد. وكنظم لاسترجاع المعلومات حقق الجيل الثاني قدرا كبيرا من التطور في 
الوظيفية والأداء. 
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ويمكن أن يكون الجيل الثالث لنظم استرجاع الإنترنت» قد أحرز المزيد من 
الارتقاء بمستوى المخواص الواردة في الجدول رقم 8/ ؟؛ فلم تعد الوسائط المتعددة 
تعامل أولا بمعزل عن المعلومات النصية؛ في الجيل الجديد لنظم استرجاع الإنترنت» 
وإنما تكاملت تقنيات تجهيز الوسائط المتعددة واسترجاعهاء مع تلك الخاصة 
بالمعلومات النصية. ونظرا لتميز العنكبوتية بقدرتها على تقديم المعلومات متعددة 
الوسائط» ولأنها قد أصبحت التطبيق الرئيس للإنترنتء فإنه لم يعد هناك مبرر لأن لا 
تكون هناك قدرة على تقديم الوسائط المتعددة» وتجهيزها واسترجاعهاء جنبا إلى جنب 
مع المعلومات النصية» مسايرة لتطور البحث في استرجاع معلومات الوسائط 
المتعددة. ثانياء تكاملت الأدلة ومحركات البحثء بدلا من توافرها ببساطة في الموقع 
نفسه. وبذلك يمكن للمستفيد أن يبحث في حدود فئة قابلة للتصفح (كما يتم 
بياهو!)؛ ثم تتجمع نتائج عمليات البحث في فئات للتصفح (ك في كلاستي 
'(51نا01). وفضلا عن تكشيف الكلمات المفتاحية» أصبح من الممكن لتكشيف 
المفاهيم أن يتمء بعد أن تحقق المزيد من التقدم في البحث حول معالجة اللغة الطبيعية 
والتعبير عنها. كذلك يمكن لمقومات البحث التي كانت تدعمها الأجيال السابقة» أن 
يرتفع مستواها وتتعززء بالتركيز على الارتقاء بمستوى التحقيق. كما يتم أيضا إدخال 
مقومات بحث إضافية (كالبحث في اللغة الطبيعية على سبيل المثال) في رصيد 
مقومات الاسترجاع التي يوفرها النظام. وكذلك يمكن توجيه طريقة تعديل البحث 
بشكل أوضحء نحو تضييق عمليات البحث على نحو فعال؛ نظرا لأن المستفيد عادة 
ما تغمره الأعداد الهائلة للنتائج التي تسفر عنها نظم استرجاع الإنترنت. ويمكن 
لتقديم نتائج عمليات البحث أن يرتب طبقيا على نحو مثالي» وأن يطوع تبعا 
لمواصفات المستفيد بدلا من خيارات النظام المحددة سلفا. فجوجلء على سبيل 
المثال» في واجهة بحثه المتطورة» يكفل للمستفيد أن يقرر من بين أشياء أخرىء ما إذا 
كان من الممكن للتتائج المزعجة أن يتم التخلص منهاء أو ما إذا كان من الممكن 
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لصفحات في نطاق شبكة معينة أن تتاح. ويمكن لنظم استرجاع الإنترنت من الجيل 
الثالث» أن تكون قادرة على إبراز تطورات ملحوظة في أداء الاسترجاع. 

وكا يتبين من هذه التوصيفاتء فإن نظم استرجاع الإنترنت كم)| يبدو قد 
تخطت جيلها الأول» وتتقدم بقوة في الجيل الفاني. وقد بدأ الجيل الثالث يلوح في 
الأفق» بإمكانيات قوية. ولقد لاحظنا منذ منتصف العقد الأخير من القرن العشرين» 
تغير أجيال نظم استرجاع الإنترنت» نظرا للتطور السريع للإنترنت» التي من أجلها 
صممت أدوات الاسترجاع تلك. ولايمكن المبالغة في أهمية الإنترنت في مجال 
استرجاع المعلومات» وخصوصا في العصر الرقمي. 


نظم استرجاع الإنترنت واسترجاع المعلومات: 

لم تعد الإنترنت مستودعا عملاقا للمعلومات فحسبء وإنها أصبحت أيضا 
منصة مألوفة للوصول إلى أنواع أخرى من نظم استرجاع المعلومات. ونظم استرجاع 
الإنترنت أدوات لاغنى عنها ولاشك لاسترجاع المعلومات من الإنترنت. كذلك 
تعد هذه النظم بمثابة بوابات لمصادر المعلومات الأخرى. ونظرا لضخ المزيد والمزيد 
من المعلومات على الإنترنت» يمكن لأهمية نظم استرجاع الإنترنت أن تزداد تناسبيا. 

وفضلا عن ذلك. فإن نظم استرجاع الإنترنت تتحول الآن إلى مختبر ونافذة 
عرض للأساليب الحديثة المتقدمة المتطورة لاسترجاع المعلومات؛ وهذا هو الدور 
الذي :هضت به نظم الخط المباشر في الماضي. ولكي يظل مواكبا لأحدث التطورات في 
مجال استرجاع المعلومات» يتعين على المرء مراقبة نظم استرجاع الإنترنت» بدلا من 
نظم الخط المباشر أو الأنواع الأخرى من النظم» عن كثب. فالتغيرات تحدث 
باستمرار» إن لم تكن على أساس يومي في نظم استرجاع الإنترنت. والنشرات 
الإخبارية القائمة على الإنترنت» وقد نشأت المواقع (مثل 4صفط]” :20089 ,ووع1ه31 
58 ,11013 12007) لإحاطة المستفيد علم| بأحدث التطورات حول هذه النظم. 
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ومن ناحية أخرىء فإن نظم استرجاع الإنترنت كفئة» سيئة السمعة» نظرا 
لانخفاض معدل التحقيق في أدائها في البحث. وقد لا يكون من الممكن الوصول إلى 
المعلومات التي تسترجع من الإنترنت» نظرا لعوامل كالروابط المتقطعة والمتقادمة» 
وهذه نتيجة أقل احتالا بكثير في البيئات الأخرى لاسترجاع المعلومات؛ كذلك يتعين 
على المستفيد أن يكون مسئولا أيضا عن الحكم على جودة المعلومات؛ نظرا لأن تقنية 
ضبط الجودة بالنسبة للمعلومات على الإنترنتء إن توافرت: فإنها في أحسن الأحوال 
مفككة البنيان إلى حد بعيد (ى) هو الحال على سبيل المثال» حين| كانت فهرسة مصادر 
الإنترنت تتم للنظم القائمة على الأدلة). 

والبحثء كا ذهب برور (2001) 188568967, هو أبرز وأهم جوانب الإنترنت» 
بعد الاتصال. ونظم استرجاع الإنترنت مصممة على وجه التحديد؛ لأغراض 
الاسترجاع. يضاف إلى ذلك أن هذه النظم يتم التعامل معها بلا رسوم بالنسبة 
للمستفيد النهائي إذا منا توافرت له فعلا فرصة التعامل مع الإنترنت. ومن ثم فإنه لا 
مبالغة في القول بأن نظم استرجاع الإنترنت تتبوأ مكانة بارزة في حقل استرجاع 
المعلومات: في الوقت الراهن» وسوف تظل كذلك لزمن طويل في المستقبل. 

وعل الرغم من أن نظم استرجاع الإنترنت تبدو واعدة» وبشكل استثنائي في 
حقل استرجاع المعلومات» فإن التحديات التي تواجهها يمكن أن تظل بحاجة إلى 
المزيد من الجهد (2008 ,3/183:©1). وتعتقد ماريسا ماير 11876 1/181:1553؛ نائب 
رئيس جوجل لنتجات عمليات البحث وخيرات المستفيدين» أن البحث لا يتفق 
وقاعدة 8١-7١‏ المعتادة(”). وإنما بقدر ما يتعلق الأمر بجوجلء فإنه قد حل حوالي 4٠‏ 


(*) ينص مبدأ باريتو 585660؛ الذي يعرف أيضا بقاعدة ,8١0-7١‏ وقانون القلة الحيوية لهاة؟ 
*88: ومبدأ تشتت العوامل؛ على أنه بالنسبة لكثير من الوقائع» فإن حوالي من النتائج تتأتى 
من /7١‏ من الأسباب. وقداقترح جوزيف إم. جوران 1538ال .11 طمء5و0ل» استشاري- 
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بالمئة من مشكلات البحثء إلا أن العشرة بالمئة الأخيرة» من حلول مشكلات البحث 
تمثل أكثر من 40 بالمئة من العمل. وتشمل أمثلة المشكلات في العشرة بالمئة الأخيرة: 
البحث المتنقل أو الجوال طععموءد علأطمه (ب) في ذلك الأجهزة القابلة للارتداء أو 
الحمل ©281). وبحث الأصوات. واللغة الطبيعية» وبحث الوسائط المتعددة 
الاق كب الظريهنة العائبة غيل قري وتقاتم لصحت القن تداق وشائط 
(كالصور ومقاطع الفيديو) التي تعد أكثر ملاءمة للمستفيد. ومن هذا المنظور. لا 
يزال أمام نظم استرجاع الإنترنت كفئة» شوط طويل» يمكن أن تقطعه في حقل 
استرجاع المعلومات. 


نظم استرجاع المعلومات: بعض الاتجاهات: 

شهدت العقود الأخيرة نمو نظم استرجاع المعلومات» وتطورها في أبعاد 
كثيرة. وقد أحدث العصر الرقمي» وخصوصا تقنيات الشبكات» تغيرات في نظم 
استرجاع المعلوماتء التي لم تعد تعمل بمعزل بعضهما عن بعضء تبعا لنوعية النظم» 
وإنما لا تعمل هذه النظم بعضه| عن بعض . في حدود إحدى فئات نظم استرجاع 
المعلومات فحسبء (كنظم الخط المباشر مثلا) وإنما تندمج أيضا عبر خطوط 
حدودها. ومن ناحية أخرى تتيح تطبيقات الجيل الثاني للعنكبوتية الناشئ (كالتمييز 
الاجتماعي والموسوعات المصغرة 15ك1811 على سبيل المثال) للمستفيدين القدرة على أن 
يصبحوا مساهمين في استرجاع المعلومات» ومن ثم فإنهم لا يكتفون بمجرد الانتظار 
على الطرف المتلقي في عملية تنظيم المعلومات واسترجاعها. ونكرس الأقسام الفرعية 
التالية لحذين الاتجاهين فيم| يتعلق بنظم استرجاع المعلومات. 


-إدارة الأعمال» هذا المبدأء وأساه باسم رجل الاقتصاد الإيطالي فلفريدو باريتو 77118600 
م)ءموط: الذي لاحظ عام 407 1ء أن 8٠١‏ من الأراضي يمتلكها ٠‏ من السكان. (المترجم) 
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اندماج نظم استرجاع المعلومات: 

يتبين من المعالجات والمناقشات في هذا الفصلء أن لكل نوع من نظم استرجاع 
المعلومات ملامحه ومقوماته الخاصة. ووظائفه وإمكانياته في استرجاع المعلومات» وإن 
كانت جميع هذه النظم مصمنة؛ وتدار لأغراض استرجاع المعلومات. وقد بدأت 
مؤخرا مختلف نظم استرجاع المعلومات تندمج» من أجل توفير خدمات استرجاع 
معلومات أفضل وأكثر ملاءمة للمستفيدين. ويمكن للاندماج أن يتخذ أيا من 
الأشكال التالية. 


والشكل الأول للاندماجء من الناحية التازيخية» هو تحميل نظم الأسطوانات 
المكتنزة على الفهارس المتاحة على الخط المباشر. ولما كانت هذه الأخيرة يتم إنشاؤها 
بوجه عام للمكتبات القائمة بذاتهاء التي تقتني أيضا نظما للأسطوانات المكتنزة» يقوم 
كثير من المؤسسات بدمج هذين النظامين معاء بعد أن تؤدي الفئة الأخيرة رسالتها 
كاملة. ويتم توفير روابط من الفهرس المناح على الخط المباشر إلى الأسطوانات 
المكتنزة» الأمر الذي يمككّن المستفيد من التعامل مع النظامين المختلفين لاسترجاع 
المعلومات في مكان واحد. كذلك تنشئ بعض المؤسسات روابط من فهارسها المتاحة 
على الخط المباشرء إلى نظم الخط المباشر» حتى يمكن التخلص من إجراءات الربط 
التي كان من الممكن أن تكون منفصلة عن بعضها البعضء عندما يكون المستفيد 
بصدد إجراء أي عمليات بحث على الخط المباشر. ويتم هذا الاندماج في الأساس عند 
مستوى الترابط بين النظم. 


ويحدث الشكل الثاني للاندماج عند مستوى محتوى مراصد بيانات النظمء 
وذلك بين الفهارس المتاحة على الخط المباشر ونظم الخط المباشر. فمن الممكن على 
سبيل المثال» لعملية بحث في الفهرس المتاح على الخط المباشرء أن تبين'أن وعاء بعينه 
لا وجود له في مجموعات المكتبة» وحينئذ يمكن للاستفسار عن ذلك الوعاء أن يقدم 
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لنظام الخط المباشرء الذي يرتبط به الفهرس المتاح على الخط المباشرء لمعرفة ما إذا كان 
الوعاء في نظام الخط المباشر أم لا. ومن المرجح إلى حد بعيد» أن تستخدم نظم الإمداد 
بالوثائق 06119639 001122621 (مثل بروكوست 670011656) للحصول على نسخة 
من الوعاء. إلا أن الرابطة بين الفهارس المتاحة على الخط المباشرء ونظم الخط المباشرء 
هي التي تيسر فعلا عملية الاسترجاع. 

ويحدث النوع الثالث من الاندماج عندما يتزايد استخدام العنكبوتية فائقة 
البناء أو التنظيم 210 كمناصة لنظم أستر جاع الإنترنت. إلى جانبا 
استخدامها من أجل نظم الخط المباشر» ونظم الفهارس المتاحة على الخط المباشر. 
وتصبح نظم استرجاع المعلومات هذه مترابطة» بحيث يصبح ما بينها من حدود غير 
واضحة المعالم. فالحقل 407 في مارك ©24818- على سبيل المثال» وهو مواصفة 
معيارية للفهرسة- يتم تخصيصه لتسجيل الأماكن الموحدة للمصادر 11181:5 الخاصة 
بمصادر الإنترنت. ويمكن للناتج النهائي لهذا الأسلوب أن يكونء كا بينا في القسم 
7/ 7؛ فهارس متاحة على الخط المباشرء بالنسبة لمصادر الإنترنت. وفضلا عن 
ذلك هناك المزيد والمزيد من الكتب والدوريات التي تنشر إلكترونيا على العنكبوتية» 
وتتكامل مع مجموعات المكتباتء ويتم تمثيلها في الفهارس المتاحة على الخط المباشر. 
ومن ثمء فإن المعلومات المتوافرة على الإنترنت» التي كانت فيا مضى هدف نظم 
استرجاع الإنترنت بلا منازع» تشملها الفهارس المتاحة على الخط المباشر» التي كانت 
فيها مضى مخصصة كلية لتنظيم مجموعة المكتبات واسترجاعها. وقد أدى هذا 
الأسلوب إلى تحقيق الاندماج بين الفهارس المتاحة على الخط المباشر» ونظم استرجاع 
الإنترنت. ويمكن أن نجد مثالا آخر لمشل هذا الاندماج» حيث! تشتمل وثائق 
العنكبوتية على إشارات مرجعية أو استشهادات» تغطيها نظم الخط المباشر. وإذا 
افترضنا أن كانت إحدى وثائق العنكبوتية» إلى جانب استشهاداتها المرجعية» قد أمكن 
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العثور عليها بمساعدة أحد نظم استرجاع الإنترنت» فإنه يمكن للمستفيد أن يواصل 
البحث في نظام الخط المباشرء الذي يشتمل على الاستشهادات المرجعية المرتبطة 
بروابط فائقة. ويتحقق الترابط بين نظم الفط المياشر» ونظم استرجاع الإنترنت 
بسلاسة وبلا أدنى معوقات. 

ومن منظور أكثر اتساعاء فإن العنكبوتية في سبيلها لأن تصبح المنصة بالنسبة 
للتعامل مع مختلف فئات نظم استرجاع المعلومات. ومن وجهة نظر أقل اتساعاء فإنه 
ليس من المستبعد بالنسبة لمستفيد ماء أن يتعامل مع منظومة معلومات مكتبة قائمة على 
العنكبوتية» تشمل جميع أنواع نظم استرجاع المعلومات؛ أي فهرس المكتبة المتاح على 
الخط المباشرء ونظم الخط المباشر التي تشترك فيها المكتبة» وبععض نظم استرجاع 
الإنترنت التي ترى المكتبة إتاحتها. فهل يمكن للعنكبوتية أن تصبح المدصة الوحيدة 
بالنسبة لنظم استرجاع المعلومات في المستقبل؟ هل يمكن لمنصة مشتركة أن تعمل على 
الحث على المزيد من الاندماج بين نظم استرجاع المعلومات؟ ما التأثير المحتمل 
للاندماج على المستفيد؟ لازلنا حتى الآن في انتظار إجابات لهذه الأسئلة. 


الجيل الثاني للعنكبوتية ونظم استرجاع المعلومات: 

لقد كان لظهور تطبيقات الجيل الثاني للعنكبوتية 2.0 7776» كالموسوعات 
المصغرة كفل والتمييز الاجتماعي», ولاشكء تأثيره على تنظيم المعلومات 
واسترجاعها بوجه عام؛ وعلى نظم استرجاع المعلومات على وجه الخصوص. ففي 
القسم 5/١/7‏ ورد الجيل الشاني للعنكبوتية بوصفه عنصرا في مناقشة التمييز 
الاجتماعي (أو التميبز بإيجاز) ودوره في التكشيف: وفي سياق نظم استرجاع 
المعلومات بدأت المدونات» والتمييز» والموسوعات المصغرة» تحدث تأثيرا ملحوظا 
على عملية استرجاع المعلومات. 


فالمدونات عادة ما تستخدم في نطاق نظام استرجاع المعلومات» حتى يكون 
بإمكان المستفيد التعليق» على سبيل المثال» على الكتب التي اقتنتها إحدى المكتبات» أو 
المقالات المسترجعة من أحد نظم الخط المباشر. وتساعد رسائل المدونات من هذا 
النوع المستفيدين الأنداد في اتخاذ قرار ما إذا كان عليهم محاولة الاطلاع على مقالة 
بعينهاء أو مراجعة كتاب معين. وقد تم وضع الموسوعات المصغرة في نظم استرجاع 
المعلومات (مثل 71161 ه86 لجوج ل) للسماح للمستفيدين بوضع لمساتهم 
الشخصية على ما يسترجعه ويقدمه نظام استرجاع المعلومات» وذلك بالارتقاء ٠‏ 
بالنتائج» وإضافة نتائج جديدة» وحذف نتائج قدمت من قبل» وتسجيل التعليقات 
(2008 ,0101655. ويقودنا هذا التطبيق» على نحو ماء للاقتراب من تطويع طريقة 
تقديم نتائج عمليات البحث» كجزء من إضفاء الطابع الشخصي على البحث. وبناء 
على طبيعته الفريدة؛ يتزايد على نحو مطرد. إدخال التمييز في نظم استرجاع 
المعلومات» كوسيلة لتوفير نقاط وصول إضافية من وجهة نظر المستفيد. وقد بداً 
ظهور نظم استرجاع المعلومات التي تنطوي على تطبيقات الجيل الثاني للعنكبوتية 
0 «اعالآ؛ فتو كولاب في إلزفير 101969165 24 01185 2, على سبيل المثال» وهو 
شريك رئيس في نظم الخط المباشر» منصة لاسترجاع المعلومات؛ تكفل للمتعاملين 
معها الاستفادة من التمييزء والموسوعات المصغرة» وماياثلها من تطبيقات 
العنكبوتية 21.١‏ أثناء التعامل مع نظمها على الخط المباشر (مثل ساينس:دايركت 
1011 ععدءق5) وسوباكس 5024005 (05) 084 لوء50)., وهي نظم فهارس 
متاحة على الخط المباشر يخواص العنكبوتية ”.٠‏ وقظعطمع]5 و2008 رعءط8132) 
(2007,؛ على الرغم من وجود قليل من التطبيقات. 
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وما يمكن أن يسفر عنه تكامل نظم استرجاع المعلومات وتقنيات العنكبوتية 
.٠‏ فعلاء في حقل تنظيم المعلومات واسترجاعهاء مجرد احتمالات. إلا أن هناك أمرا 
واحدا يتضح فعلا بجلاء؛ فالمستفيدون يبدون متحمسين فعلاء فيم| يتعلق بقدرتهم 
على الإسهام في استرجاع المعلومات. بين| بدأ دارسو النظم واختصاصيو المعلومات 
النظر على نحو جاد في سبل جعل هذا التكامل ذا قيمة بالنسبة لكل 
الأطراف المشاركة. 
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الفصل الناسع 


استرجاع المعلومات الفريدة في محتواها 
أو في شكلها 


لقد استكشفنا حتى الآن موضوع استرجاع المعلومات» مفترضين أن المعلومات 
في المقام الأول نصوص بالإنجليزية» ولا بنيان خطي. ويركز هذا الفصل على استرجاع 
المعلومات الفريدة في محتواها أو في شكلهاء أي المعلومات متعددة اللغات؛ ومعلومات 
الوسائط المتعددة» ومعلومات النصوص الفائقة أو الوسائط الفائقة. 


المعلومات متعددة اللغات 

هناك ما يقارب من 5417 لغة حية في العالم» من بينها 7١47‏ تستعمل في 
أفريقياء و7١٠٠‏ في الأمريكتين» و79١١‏ في آسياء و7794 ني أوروياء و١٠1١‏ في 
المحيط الطادئ (15 .م ,2005 ,70008)). وبناء على تقدير أعد في فبراير عام ١1191‏ 
كانت اللغات الأولى الثلاث المتربعة على القمة» في العالم في ذلك الوقت» هي الصينية 
التقليدية المبسطة عوعصلطن) سأمهلصة3 (886 مليون ناطق مها)» والإسبانية (؟95؟7 
مليون ناطق بها)» والإنجليزية (؟7؟7 مليون ناطق بها) (2000 و5388205). وبينا يمكن 
لبشر في حياتهم اليومية» الاعتماد على لغتهم الأم دون سواهاء فإن العالم أحادي اللغة 
زائل حتما في هذا العصر الرقميء بقدر ما يحظى تنظيم المعلومات واسترجاعها 
بالاهتام؛ نظرا لآن المعلومات يتم تسجيلها وتبادها بلغات متعددة» في شتى أنحاء 
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العالم» بها في ذلك الإنترنت. ومن ثم فإن الخاجة إلى تنظيم واسترجاع المعلومات 
متعددة اللغات» تصبح ضرورية» حتى وإن كان من الممكن للغة واحدة أن تكون لها 
السيطرة في وسط معينء إذا ما كانت تلك اللغة هي ما يستعملها معظم البشر هناك. 
وبعبارة أخرى فإن بيئة تنظيم المعلومات واسترجاعها برمتهاء ينبغي أن تكون متعددة 
اللغات. لتلبية الاحتياجات المعلوماتية لمختلف فئات المستفيدين الذين يتحدئون 
لغات مختلفة. 1 

ولقد كانت الإنجليزية هي اللغة الرئيسة للاتصال العلميء منذ الحرب العالمية. 
الثانية» ولا تزال في الصدارة بين جميع اللغات المستعملة على الإنترنت حتى الآن. ومع 
ذلك فإن الفجوة بين الإنجليزية واللغات الأخرى (كالصينية والإسبانية على سبيل 
المثال)» تتراجع بسرعة في أوساط المتعاملين مع الإنترنت. وكما ذهبت مجموعة 
مينيواتس للتسويق (2009) «نا0ك1 عصناء112:1 8110172115 على سبيل المشال» 
فإن لغات القمة الثلاث التي تستعمل على الإنترنت» كانت الإنجليزية (18.1 بالمئة)» 
والصينية 7١.1‏ بالمئة)» والإسبانية 6.١‏ بالمئة)» وذلك في يوني و عام :70١04‏ وفي 
مقابل ذلك كانت النسبة المئوية للمعلومات بالإنجليزية أعلى بكثير» عندما انطلقت 
الإنترنت جماهيريا في مطلع العقد الأخير من القرن العشرين. ويدل هذا التغير على 
حقيقة أن الإنترنت في سبيلها على الأقل» لأن تصبح متعددة اللغات على نحو أكثر. 

وينبغي للمعلومات متعددة اللغات أن يتم ترميزها للتجهيز بواسطة 
الحاسبات» قبل أن يكون من الممكن تنظيمها واسترجاعها رقمياء واليونيكود 
100 مواصفة معيارية وضعت خصيصالمثل هذه الأغراض» بحيث يكون من 
الممكن ترميز أو تكويد كل حرف أو رمز في أي لغة» برقم فريد بالبايت» بصرف النظر 
عن المنصة أو التطبيق (156.,2008 ,و60916006). وفي زمن ما قبل اليونيكود. كان 
لكل لغة نظام التكويد الخاص ببهاء على نحو يجعل التشغيل التبادلٍ فيه| بينها ضربا من 
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المستحيل. فقد كان الآسكي 450011 (الكود المعياري الأمريكي لتبادل المعلومات 
1111617112115 121011211011 “101 ع000) 51220310 05118 الشهير» 
مصم] لتكويد الهجائية الإنجليزية» ولكنه لا يستطيع معالجة الأحرف في اللغات 
الأخرى (كالصينية مثلا). كما اتضح أيضا أن اليونيكود ضرورة بالنسبة لتطور 
الإنترنت؛ نظرا للمعلومات متعددة اللغات» التي تعالجها الشبكة الكونية معالجة 
الأحرف في اللغات الأخرى (كالصينية مثلا). كى) اتضح أيضا أن اليونيكود ضرورة 
بالنسبة لتطور الإنترنت؛ نظرا للمعلومات متعددة اللغات. التي تع لجها الشبكة 
الكونية (2003 ,161865). واليونيكود ليس ضروريا في تكويد المعلومات متعددة 
اللغات للمزيد من التجهيز الرقمي فحسب. وإنما يكفل لمتصفح العنكبوتية القدرة 
على اكتشاف ما إذا كانت صفحة العنكبوتية الواردة أمامه؛ تستخدم إحدى خظطط 
التكويد المركبة فعلا على حاسب المتصفح (2005 ,00316). ودعم هذه الوظيفة 
الأخيرة يلغي اليونيكود حاجة المتعامل لأن ينتقل يدويا من إحدى خطط التكويد 
(كالإنجليزية مثلا) إلى أخرى (كالصينية مثلا) عندما يكون بصدد النظر في معلومات 
متعددة اللغات كنتائج إحدى عمليات البحث مثلا. 


استرجاع المعلومات متعددة اللغات في الماضي: 

قبل ظهور الإنترنت» ونظم استرجاع الإنترنتء كانت المعلومات متعددة 
اللغات تدخل في نظم الخط المباشر» ونظم الأسطوانات المكتنزة» ونظم الفهارس 
المتاحة على الخط المباشر» على أساس انتقائي. وعادة ما تتبع هذه النظم سياسة للانتقاء 
في| يتعلق بتجميع المعلومات متعددة اللغات؛ فقد كان من الممكن على سبيل المثال» 
توفير مقومات الترجمة أو النقحرة 1146586405كصة*2»1 إذا كان من المزمع إدخال لغة 
معينة. وفي نظم استرجاع المعلومات متعددة اللغات. لم يكن العثور على المعلومات 
باستعمال اللغة نفسها التي سجلت بها المعلومات (كالبحث عن المعلومات الصينية 
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باستعمال استفسارات بالصينية على سبيل المثال) فيه| يبدو يحظى بالدعم على نطاق 
واسع؛ على الرغم من أنه كانت هناك بعض الاستثناءات. ويمكن القول بوجه عام أن 
المعلومات باللغات الأجنبية كانت تنقحر لأغراض الاسترجاع في الفهارس المتاحة 
على الخط المباشر. وغالبا ما تستعمل نظم الخط المباشر» ونظم الأسطوانات المكتنزة» 
لغة أولى لتنظيم معلومات اللغات الأجنبية (في التكشيف والاستخلاص على سبيل 
المثال): وكان من الممكن استرجاعها فيها بعد باللغة الأولى نفسها. 

وهناك نظم مصممة لاسترجاع المعلومات متعددة اللغات مباشرة» بدلا من 
استرجاعها عن طريق الترجمة والنقحرة؛ فالفهارس المتاحة على الخط المباشرء في 
الصين على سبيل المثال» عادة ما تدعم طريقتين لغويتين» إحداهما للغة الصينية» 
والأخرى لما يسمى اللغات الغربية» كالإنجليزية والفرنسية مثلا. وبإمكان المتعاملين 
استعمال الصينية على سبيل المثال» لاسترجاع المعلومات بالصينية» والإنجليزية 
لاسترجاع المعلومات بالإنجليزية. وكان من المفترض في نظم استرجاع المعلومات 
متعددة اللغات» أن تسفر عن نتائج أفضل من تلك التي تعتمد على الترجمة والنقحرة» 
لآن النظم متعددة اللغات بإمكانها تجنب إدخال المزيد من مظاهر التفاوت أو 
الاختلافء التي يمكن أن تنجم عن الترجمة أو النقحرة» في عملية الاسترجاع. 
استرجاع المعلومات متعددة اللغات على الإنترنت: 

على الرغم من أن نظم الخط المباشرء والأسطوانات المكتنزة» والفهارس المتاحة 
على الخط المباشرء تجمع معلومات متعددة اللغات, فإن الحاجة إلى استرجاع المعلومات 
متعددة اللغات في تلك البيئات». لا تبدو قوية ى] هي على الإنترنت» نظرا للعوامل التالية: 
أولاء أن تغطية المعلومات متعددة اللغات في تلك النظم» كانت انتقائية إلى حد بعيد» كم| 
تقتصر على المعلومات عالية الجودة. ثانياء أن الإنترنت شبكة كونية للشبكات» ومن 
الطبيعي أن تحمل معلومات متعددة اللغات, أكثر بكثير من الأنواع الأخرى من نظم 
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استرجاع المعلومات. ثالشاء يسهم غياب تدابير ضبط الجودة» كم بينا في القسم 
١ 01‏ كذلك في ازدهار المعلومات متعددة اللغات على الإنترنت. 

ومما لاشك فيه أن الإنترنت» كبيئة لاسترجاع المعلومات» تختلف عن البيئات 
الأخرى لاسترجاع المعلومات, نظرا لتعدد فئات أو اخحتلاف خصائص المتعاملين 
معها. وقد تكهن فالوز (2007) 1"8110775» عند الكتابة لمشروع إنترنت المقصورة 
واحياة الأمر يكية أ210(66 عكرآ مقءسعسة لصة أعصعلم1 و0 أن يكون من 
الممكن للصين أن تحل محلى الولايات المتحدة الأمريكية؛ في إجماالي عدد المتعاملين» في 
غضون سنوات قليلة. وقد تأكد هذا التكهن أسرع ما كان متوقعاء من جانب مركز 
معلومات شبكة الإنترنت الصينية 0:03811083كه1 ع701مء11 أعسنرعام1 ممنط0) 
(©111710©) #عادء0). عندما أعلن أن المتعاملين مع الإنترنت في الصين بلغ إجمالي 
عددهم 798 مليون» في نهاية ديسمير عام ٠٠١8‏ (2008 ,107/10©). ويدل تقرير 
مركز معلومات شبكة الإنترنت الصيئية؛ إلى جانب البيانات الواردة من مجموعة 
مينيواتس للتسويق (2009 ,وم03*) عصناءء!: 812 2)15 1م 811). فيا يتعلق بعدد 
لمتعاملين مع الإنترنت في دول كاليابان» وفرنساء وألمانياء يدل على أن الإنترنت تغادر 
كما يبدو ماضيها أحادي اللغة. وتتعامل نظم استرجاع الإنترنت مع قضية استرجاع 
المعلومات متعددة اللغات, إما بدعم عمليات البحث متعدد اللغات, وإما بتوفير 
مقومات الت رحمة التي طورتها شركات مثل سيستران (012ع.]88.5350182501) 
41خ511آ5. ى] كان لآلتافيستا 4148871518 الريادة في كل من المجالين. بالتعاون 
مع سيستران, بينما حذت كثير من نظم استرجاع معلومات الإنترنت الأخحرى (مثل 
جوجل) حذوه. وخصوصا في مجال البحث متعدد اللغات. ٠‏ 

وعندما بدأ تطور نظم استرجاع الإنترنت» كانت الإنجليزية هي اللغة الوحيدة 
التي يمكن للمتعاملين استعالها للاسترجاع. وبمقدور هؤلاء المتعاملين البحث الآن 


335 


في الإنترنت» باستعمال أكثر من اثنتي عشرة لغة مختلفة» تشمل الإنجليزية» والصينية» 
والفرنسية» والألمانية» والإسبانية» والروسية. ومن الممكن إجراء البحث متعدد 
اللغات في الإنترنت بطريقتين؛ الطريقة الأولى هي إجراء البحث باستعمال أحد نظم 
استرجاع الإنترنت المصمم خصيصا للغة معينة (مثل ياهو! في فرنسا) وذلك 
باستفسارات بحث بتلك اللغة. والطريقة الثانية هي قصر نتائج البحث على لغة 
بعينهاء بانتقاء اللغة التي يقع عليها الاختيار» الواردة على الصفحة الرئيسة لأحد نظم 
استرجاع الإنترنت. ؤيظل استفسار البحث بالإنجليزية على سبيل المثالء إلا أن 
النتائج يمكن أن تكون باللغة المحددة (كالإسبانية مثلا). وينبغي للاسترجاع من هذا 
النوع, أن ينظر إليهء بالمعنى الدقيق» بوصفه استرجاعاً للمعلومات عبر اللغات» الذي 
نعالجه في القسم 4/ /١‏ ”. 

وفضلا عن البحث متعدد اللغات» يمكن الحصول على المعلومات متعددة اللغات 
على الإنترنت بواسطة الترجمة» وذلك بفصل الجهود المشتركة التي تبذهها نظم استرجاع 
الإنترنت. وشركات برمجيات الترجمة الآلية. وتضافر الجهود بين التافيستا 4188158 
وسيستران 1ال55/51784 مثال على ذلك؛ فمن الممكن على سبيل المثال» ترجمة أي نتائج 
.يتم استرجاعها بواسطة آلتافيستاء من الإنجليزية» إلى الصينية» أو الفرنسية» أو الألمانية» أو 
الإيطالية» أو اليابانية» أو الكورية» أو الإسبانية» أو البرتغالية» والعكس صحيح. وذلك 
باستعمال برمجيات سيستران» وإن كانت جودة الترجحمة ليست مرضية تماما؛ نظرا لأوجه 
القصور الكامنة في الترجمة الآلية (1999 رصأعلله08. 


البحث حول استرجاع المعلومات متعددة اللغات: 
اجتذب استرجاع المعلومات متعددة اللغات اهتام الباحثين في السنوات 


الأخيرة» وأصبح مساراً (أي مشكلة فرعية بعينها للاسترجاع في ترك : حتى ترك 1 
1121-6 تاعناهغط؛ 11810-4). وقد تناول المسار متعدد اللغات بالدرس» قضايا 
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استرجاع المعلومات بلغات غير الإنجليزية. وقد تمت دراسة الإسبانية والصينية. 
اللغتين غير الإنجليزيتين المستخدمتين على أوسع نطاق (2005 ,00408©)؛ من 
جانب أكثر من عشرين فريقا للبحث؛ من عام ١496‏ حتى عام 14917. وتبين 
للباحثين (2000 ركعصول عاءمقم5) أن: 
يبدو الامتداد إلى الإسبانية متعددة اللغات متواضع نسبياء 
أما إلى الصينية فأكثر إإلحاحا لتغطية نظام كتابة يختلف اختلافا 
جوهريا. ومن ثم فإنه يثير قضية ما إذا كان في التطبيق؛ في مقابل 
المبادئ الأساسء أن طرق التكشيف والبحث التي تطورت 
للإنجليزية؛ كتلك التي تستخدم الأساليب الإحصائية؛ يمكن أن 
تنتقل إلى لغات أخرى مختلفة تماماء وأن تكون فعالة بالنسبة لتلك 
اللغات. (46 .2) 
وتتطلب اللغات المختلفة بالفعل» نظم استرجاع معلومات بإمكانيات مختلفة» 
لمعا لجة خصائصها المميزة. فمن المهام المثيرة للتحديات إلى حد بعيد؛ على سبيل المثال» 
تحليل النص الصيني آليا إلى مصطلحات استفسار لها دلالتها؛ نظرا لأنه لا يوجد فراغ 
بين الكلمات في الكتابة الصينية إلا في نهاية الجملة. ومن ثمء قارنت معظم فرق 
البحث المشاركة في مسار الصينية متعددة اللغات في ترك -5 6-):11418, طرق تحليل 
مختلفة (2000 ,112222 يعن ووع8700). والبحث بمراعاة شكل الحخحرف الأول» 
وهو من الأساليب الرئيسة لاسترجاع المعلومات في الإنجليزية» غير قابل للتطبيق في 
الصينية» نظرا لأنه ليست هناك حروف كبيرة أو صغيرة في النص الصيني. 
والمجال المتصل بالاسترجاع متعدد اللغات» هو البحث عبر اللغات -05055) 
ع28ناعصول. الذي تتوزع فيه الوئائق على عدة لغات (كالإنجليزية. أو الألمانية» أو 
الفرنسية» أو الإيطالية على سبيل المثال) وتصاغ الاستفسارات بكل لغة من هذه 
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3 
اللغات. وقد أضيف مسار استرجاع المعلومات عبر اللغات 8#شناوهه.آ-5ووه0) 
(111ن)) 1قنع1تاع 1 صو مم1 إلى سلسلة مؤتمرات استرجاع النصوص 
118000) ععمعتعكدمن) [ومععتناطلظ8 أرعلك في عام 1و بلءابتر ل-ع 
1110-6 حتى ترك 20027٠07‏ 1518380. والمهدف الرئيس لمسار استرجاع 
المعلومات عبر اللغات» هو استرجاع الوثائق بإحدى اللغات المستهدفة» باستعمال 
استفسارات مكتوبة بلغة أخرى مختلفة. وفي ترك-”» جربت ثلاث عشرة مجموعة 
مشاركة في مسار استرجاع المعلومات عبر اللغات» ثلاثة طرق رئيسة للاسترجاع عبر 
اللغات» هي: )١(‏ الترجمة الآلية» التي كانت تترجم بها الاستفسارات أو الوثائق إلى 
اللغة المستهدفة» (؟) استعمال معاجم ثنائية اللغة قابلة للقراءة بواسطة الحاسبات» أو 
أي مصادر لغوية أخرى قائمة» و(7) استعمال رصيد من المصادر لاختبار طريقة 
الاسترجاع عبر اللغات أو لتمكينها(2000 ,1121288 © ووعط:100). وفي حدود 
ما يهم القضايا التقنية لاسترجاع المعلومات عبر اللغات 1:118:)؛ استعرض كيشيدا 
(2005) 13152102 تفصيلاء إجراءات الترجمة؛. وطرق فك غموض الترحمة. 
واستراتيجيات المضاهاة» ضمن جهود أخرى كثيرة بذها الباحثون في استرجاع 
المعلومات عبر اللغات على مر السنين. 
وقبل أن ينتهي ترك 178880 من مسار استرجاع المعلومات عبر اللغات 
+0111 في عام 2٠٠١7‏ ظهرت منصتان رئيستان أخريان لاسترجاع المعلومات عبر 
اللغات؛ والمنصة الأولى هي منتدى التقييم عبر اللغات 28118386ة.07055-1) 
(0.018ع نه ممصقء- أ 01117:99399.1)) تصتاده ص5ه46قن821 الذي هيدف إلى 
تشجيع البحث والتطوير في الوصول إلى المعلومات متعددة اللغاتء من المنظور 
الأوروبي في المقام الأول والمنصة الثانية هي مجموعة اختبار المعهد الوطني 
للمعلوماتية لورش عمل نظم استرجاع المعلومات 01 عانغتاكسآ [هصمنواح 
ومطكسعاعه؟7 (1')0:11!ظ) عددعأاك55 11 101 مملاءع0011) أمع1' ,و0121 قصل 
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ومقرها باليابان (لصغط.دع-مره<م/عصتلسه اع اسص/ملعة.تتصطءمهعوع»). وعاكاأة 
لسلسلة ترك 17810» صممت ورش عمل نظم استرجاع المعلومات 
15 71100111 لتشجيع البحث في تقنيات الوصول إلى المعلومات. بم في 
ذلك استرجاع المعلومات. واسترجاع المعلومات عبر اللغات, أحد المهام البحثية التي 
تنهض بها ورش عمل مجموعة اختبار نظم استرجاع المعلومات بالمعهد الوطني 
للمعلوماتية *2/16011. وتشمل اللغات غير الإنجليزية التي تحظى بالاهتام بانتظام 
في ورش العمل تلك. اليابانية» والصينية» والكورية. ويعمل كل من منتدى التقييم 
عبر اللغات 1.11ن). ومجموعة اختبار المعهد الوطني للمعلوماتية 17161118 بيمة 
ونشاطء على استكشاف المشكلات التي يعاني منها استرجاع المعلومات عبر اللغات. 
وعلى الرغم من تأسيس كل من مؤتمرات استرجاع النصوص ©11810) ومتددى 
التقييم عبر اللغات '1.101ن). ومجموعة اختبار المعهد الوطني للمعلوماتية 87160114 
يتم الإعراب عن المخاوف فيا يتعلق بالاهتمام الملائم بكثير من اللغات التي لا تحظى 
بالتغطية في تلك المشروعات» وتوسعة العنكبوتية متعددة اللغاتء بالإضافة إلى 
الإنتاج الفكري خلاف المعلومات الإخبارية (2005 ,وعاء2 © 00صهكا ,© ). 
وللتعامل مع تلك المخاوف. يحاول باحثو مسار استرجاع المعلومات عبر اللغات 
+111 على نحو متزايد» اختبار مثل هذه الطرق الخاصة بمعالجة اللغة الطبيعية» 
كالتقسيم الجماعي 8 نام 0سندوم60. والترجمة الآلية (من أمثال © صعط© 
8 ..[8 أء ,زه :2004 ,.31 أء ,كلستلاه8 ,2004 ووع6). ويبيدو أن الذكاء 
الاصطناعي ينهض بدور في هذه الجهود. 

وقصارى القول» فإن البحث متعدد اللغات» يعني أن تكون المعلومات 
المستهدفة» وكذلك الاستفسارات باللغة نفسهاء بينم| يعني الاسترجاع عبر اللغات أن 
تكون المعلومات المستهدفة» والاستفسارات بلغات مختلفة. وقصر نتائج البحث في 
الإنترنت على لغة واحدة بعينهاء ى) ذكرنا في 4/ /١‏ ؟» في واقع الأمر» استرجاع عبر 
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اللغات؛ نظرا لأن الاستفسار ينبغي أن يترجم من إحدى اللغات إلى لغة المعلومات 
المستهدفة» قبل إجراء عملية البحث. وسواء كان الاسترجاع متعدد اللغات, أو عبر 
اللغات» فإن المتعاملين يتعين عليهم دائم| الانتباه إلى خصائص اللغة التي سجلت بها 
المعلومات؛ نظرا لاختلاف كل لغة عن غيرها. ولا يمكن إلا من خلال هذا المنظور 
إنجاز الاسترجاع متعدد اللغات أو عبر اللغات بنجاح. 


المعلومات متعددة الوسائط: 

بناء على دراسة أجراها معهد إدارة ونظم المعلومات» بجامعة كاليفورنيا في 
بر كل 21715117[ وق2داء]575 2220 اتاعصسعع هصة]11 100 2صندمكه1 1ه [اممطاء5 
(2000 .[ة أع ومتقتصط.ط) 'زاعءعاترعظ )د متم« مكتاد0 آم ينتج العالم مابين 5-١‏ 
إكزابايت 1©5إ5815© (الإكزابايت الواحدة > بليون جيجا بايت) من المعلومات 
المختلفة سنويا. وعلى الرغم من أن تقرير الدراسة لم يحدد النسبة المئوية للمعلومات 
متعددة الوسائط من المجموع. فإن مقدار المعلورمات متعددة الوسائط (كالنشرات 
الإخبارية» ومؤتمرات الفيديو وبيانات الاستكشافء والتسجيلات السمعبصرية 
للقاءات الؤسناتة: وامتعاضزات الدراسية عل سيل الغال) يمو لهك شك 
كبير؛ نظرا لأن العنكبوتية القابلة للتكشيف على الصعيد العام» وحدها كانت تشتمل 
على ما يقدر بمئة وثمانين مليون صورة, أي ثلاث تيرابايت!) 
الصورء في فبراير عام ١944‏ (1999 ,1165© يت ع6عمع"1,810). ولما كانت العنكبوتية 
تواصل نموها السريع» وتحمل المزيد من المعلومات متعددة الوسائط. فإن الحاجة إلى 
العثور على هذه المعلومات والحصول عليهاء تزداد أيضا على نحو مطرد. 


5 من بيانات 


(*) التيرابايت تساوي تريليون بايت» أي ألف جيجا بايت. (المترجم) 
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وقدعرّفت الوسائط المتعددة؛ في الفصل الثالثء بوصفها أي جمع بين 
المعلومات الصوتية والمصورة والنصية» ويشتمل الشكل رقم "/ ١‏ على التقسيم 
الشجري للمعلومات متعددة الوسائط. وينبغي أن نلاحظ أن المصطلح “صورة” 
© يستعمل أحيانا على نحو فضفاضء للدلالة على جميع أنواع الوسائط المتعددة؛ 
نظرا لأن كلا من الصور الثابتة والصور المتحركة» يمكن أن تشتمل على معلومات 
نصية» بين| يمكن للصور المتحركة أن تشتمل أيضا على معلومات صوتية: ولما كانت 
المعلومات النصية هي موضوع المناقشة في معظم أجزاء هذا الكتاب؛ فإن التركيز في 
هذا القسم ينصب على المعلومات غير النصية» التي تتكون من الصور الثابتة» 
والأصواتء والصور المتحركة. 

0 وقد تطورت طرق وخوارزميات عدة لاسترجاع المعلومات متعددة الوسائط. 
إلا أنها تنقسم إلى فئتين عريضتين؛ هما النهج القائم على الوصف -«منامتءوء0 
طعدهممة 0ع5هقط و النهج القائم على المحتوى طاعقمعممة 0ع256ط-امع)دم». 
ويستخدم النهج القائم على الوصف. ببساطة:» يدوياء العناوين الفرعية, والكلمات 
المفتاحية» أو غيرها من الواصفات (كاسم الفنان» وحجم العمل على سبيل المثال) 
الخاصة بالمعلومات متعددة الوسائط» لأغراض الاسترجاع. ويتدخل البشر بشكل 
مباشر في عملية الاسترجاعء عند اتباع هذا النهج. ومن ناحية أخرى يدل النهج القائم 
على المحتوىء على الأساليب التى تستند إلى التجهيز الآلي للمعلومات متعددة 
الوسائط نفسها. ١‏ 

ويتم اتباع النهج القائم على الوصف. والنهج القائم على المحتوى» من جانذب 
فئتين مختلفتين من الباحتين (2000 ,2اوووتدع2 ,2001 ,ننطن) 19925 ولاعءط ه0)). 
ويبدو أن من ينتمون إلى مجال علم الحاسبات يركزون على النهج القائم على المحتوى. 
بين| تركز أوساط علم المعلومات, ب في ذلك علم المكتبات» على النهج القائم على 


341 


الوصف (1997 ,1252211553 1992 ,لاعغ[؟025)). و يأتي هذا التقسيم نتيجة 
لعاملين؛ أولهما اختلاف الخلفية الأكاديمية» وكذلك مقومات التدريب لكل من 
الفئتين من الباحثين؛ فأولاهما في علم الحاسبات والثانية في علم المعلومات. أما 
العامل الثاني فهو اختلاف طرق التجهيز التي تتبع بالنسبة لاسترجاع المعلومات 
متعددة الوسائط» في كل من النهجين؛ إذ أن النهج الأول آلي» والثاني يدوي. وتعالج 
الأقسام التالية كيف يتم تطبيق كل من النهجين في استرجاع الأنواع الثلاثة 
للمعلومات متعددة الؤسائط» وهي الصور الثابتة» والأصواتء والصور المتحركة. 
استرجاع الصور الثابتة: 

تشمل الصورء كما بينا في القسم ١/7/7”‏ كلا من الصور الثابتة والصور 
المتحركة. وتشمل الصور الثابتة الرسوم والصور الضوثية» والملصقات 05)]655م. 
وصور الوثائق (مثل ملفات صيغ الوثائق متعددة المنصات 86عصتناء20 16طهارمم 
(”101©) 84دم10) وما شابه ذلك. ومن الممكن تقسيم الصور المتحركة» التي تشمل 
الصور الثابتة بالإضافة إلى الصور المتحركة: إلى فتنين فرعيتين؛ الصور المتحركة 
المصحوبة بالصوت. التي تشكل أشرطة الفيديو أو الأفلام؛» والصور المتحركة بلا 
صوتء وهي الرسوم المتحركة أو الأفلام الصامتة. ولأغراض التوضيح. نناقش في 
هذا القسم الصور الثابتة فقطء بينما نناقش الصور المتحركة في القسم 9/ ؟/ ". 

للصور الثابتة معناها الخاص وخصائصها التي تشكل الأسس بالنسبة لمهام 
الأداء أو الاسترجاع. وفيما يتعلق بفنون عصر النهضة. يحدد بانوفسكي 5292015169 
(1955) معالم ثلاث طبقات للمعاني بالنسبة للصور. والطبقة الأولى هي ما قبل 
صنعة التهاثيل أو الأيقونات إطامقموممه1 م التي تصف المعنى الأولي أو 
الطبيعي للصورء وتنقسم الفا إلى الجوانب الحقائقية [498©]38: والتعبيرية 
5510281 كم هو الحال على سبيل المثال» بالنسبة لصورة المدينة الصاخبة» إذ 
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وصف صور ما قبل صناعة الأيقونات خبرة عملية؛ فالمديئة والمشهد الصاخب على 
سبيل المثال» من السهل التحقق منههماء بالنسبة لأولفك الذين شاهدوا مثل هذه 
الكيانات من قبل. أما الطبقة الثانية فهي صناعة الأيقونات» التي تحدد معالم المعنى 
الثانوي» أو التقليدي الذي يتم تصويره في الصورة (كصورة روما في مقابل أي مدينة 
أخرى على سبيل المثال). ويتطلب التحقق التماثيل الإحاطة بالمصادر الأدبية»:كالتآلف 
على سبيل المثال» مع ملامنح روما كمدينة. أما الطبقة الثالثة فهي دراسة الأيقونات أو 
الرموز الفنية 16020108 التى تمثل المعنى الجوهري أو القيمة الرمزية للصورة. 
ويتطلب التحقق من المعنى الجوهري للصور وتفسيره؛ الذي قلم| يكون معروفا 
للفنان» وربما يكون مختلفا بشكل قاطع عن ذلك الذي قصد الفنان التعبير عنه بوعي- 
يتطلب ”“حدسا تحليليا تركيبيا ©5328112611 مرتبطا بالسيكولوجية الشخصية“ 
(41 .م ,1955 وإكل015ه28). ومثل هذا المعنى ”يتم إدراكه بالتحقق من تلك 
الأسس التي تكشف عن الاتجاه الأساس لأمة ماء أو عصرء أو طبقة: أو ديانة؛ أو 
عقيدة فلسفية ما'' (30 .م ,1955 ولإ68201516). فبالنسبة للبعضء على سبيل المثشال؛ 
يمكن لزوما أن تعني مدينة ذات تاريخ ثريء بينم| يمكن أن تعني لآخرين المكان الذي 
تقع فيه الفاتيكان, والمعنى الجوهري للصورء ى| يبدو هو الأصعب في تفسيره. ومن 
الممكن للتفسير أن يكون مغرقا في الذاتية» إذ يتوقف على خيرة المرء وخلفيته. 

وبعد نصف قرن من بانوفسكو 28504515 تقريباء قسّم إيكنز وجراهام 
(1999) تسصقطة:ة) 3800 5نتكلواآ خصائص الصور إلى ثلاثة مستويات من التعقد 
المتزايد» ففي المستوى الأول تكون الخصائص ملامح بدائية كاللون» والنسيج» 
والشكل. ومثال استفسارات الاسترجاع القائمة على خصائص صورر المستوى الأول» 
المثلث الأحمر عاعدةت 3760 حيث ”الأجهر“ يدلعلى اللونءو يوحي 
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"المثلث” بالشكل. وخصائص صور المستوى الثاني ملامح منطقية» تتصل بهوية 
الأشياة لمشيل ف الغيور :ويك للاقياة نكو طاية كين الحم عل سيل 
المثال) أو محددة (كبرج ويليز 10765 1115ؤ7آ» الذي كان يعرف ببرج سيرز 56855 
» في شيكاغوء .على سبيل المثال). وخصائص صورر المستوى الثاني أكثر تعقدا 
من خصائص المستوى الأول؛ إذ يدل الأول منطقيا على هوية الموضوعات في صورة 
ماء أو يشتمل على معلومات تتجاوز حدود المستوى البدائي» فموضوع الصورة على 
سبيل المثال مبنى إداري» وليس شكلا أو نسيجا بعينه. وخصائص صور المستوى 
الثالث مجردة» وتنطوي على قدر لا يستهان به من الحجج أو البراهين» حول معنى ‏ 
وهدف الموضوعات أو المناظر الواردة في صورة ما (1999 ,تسقطة© *» صصاعلة8). 
وتتصل هذه المخنصائص ”بحيثيات 8501012655'“ أو محتوى أو مضمون الصورء 
كالجو الاحتفالي المصور في منظر حفل على سبيل المثال. 

ومن الممكن اكتشاف بعض مظاهر التشابه بين طبقات بانوفسكي 1292015163 
الثلاث للمعنى بالنسبة للصور.ء وخصائص الصور ثلاثية المستويات التي اقترحها 
إيكنز وجراهام (1999) تصقطة:© ده كصأءطةك1. وتتعلق الطبقة الأولى في كلتا 
الخالتين *'بالخواص 080655“ أو الخنصائص المادية للصورء إلا أن بانوفسكي أضاف 
الجانب التعبيري للصور في هذا المستوىء ولم يحلل الصور إلى بكسلات (") واعفط 
وهي المقياس الذي نشأ فيم| بعد بالنسبة للصور الرقمية. وتغطي الطبقتان الثانية 
والثالثة في كلا الخطتين الحيثيات أو المخصائص الموضوعية للصورء المتعلقة بمحتوياتها 
الدلالية. ومن الممكن التحقق من بعض الخصائص ال موضوعية بموضوعية (كتمييز 
روما عن:غيرها من المدن على سبيل المثال)» بين| يمكن التأكد من البعض الآخر ذاتيا 
فقط (مثل روما بوصفها مدينة تاريخية أو مركزا دينيا). وأيا كانت الطريقة التي تقسم 


(*) أدق دقائق النقاط التي تكون الصورة. (المترجم) 
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بها خصائص الصور إلى فئات. فإنها تشكل الأسس بالنسبة لاسترجاع معلومات 
الصور الثابتة» في كل من :بجي استرجاع الصور اللذين نناقشه| في| بعد. 
استرجاع الصور الثابتة القائم على الوصف: 

يعتمد النهج القائم على الوصف لاسترجاع الصور الثابتة» الذي يعرف أيضا 
بالنهج القائم على ما وراء البيانات؛ أو القائم على المفهوم. أو القائم على النص - 
يعتمد على التوصيفات التي يوفرها اختصاصيو المعلومات. فمن الممكن وصف 
الصور الثابتة بسماتها أو مصائصها المادية (كصورة الدببة على سبيل المثال)» بالإضافة 
إلى حيثياتها أو خصائصها الموضوعية (كالحيوانات المهددة بالانقراض مثلا). وغالبا ما 
تسمى مثل هذه التوصيفات بما وراء البيانات 206480848 في أيامنا هذه؛ وقد أسمى 
ترانت (2004) 15836 نبج استرجاع معلومات الصور هذاء بالقائم على ما وراء 
البيانات. وإذا ما كانت التوصيفات تتعلق بالحيثيات فقطء فإننا يمكن أن نسمي نمج 
استرجاع الصور بالقائم على المفهوم 0عىةط-امععههن) (1997 ردعدعتصوكت18). 
وإذا ما كانت التوصيفات معدة بالنصوص المصاحبة للصورء فإننا يمكن أن نسمي 
نبج استرجاع الصور بالقائم على النص 171-8560 (2000 ,70001353)). وحينكذ 
تصبح هذه التوصيفات الأسنس بالنسبة لاسترجاع الصور الثابتة. 

وتستخدم كل من الكلمات المفتاحية واللغات المقيدة» في استرجاع الصور 
الثابتة» وغالبا ما تشتق الكلمات المفتاحية واللغات المقيدة» في استرجاع الصور الثابتة» 
وغالباً ما تشتق الكليات المفتاحية من العناوين الفرعية؛ أو المعلومات النصية الأأخرى 
العناحة للعمور: القانة كدب كيرس أو كلا مكرظن الصور العبوفة كل سيل 
المثال). كذلك يمكن للمتعاملين اختيار مصطلحات الاستفسارات نفسها حين 
الاسترجاع. وتشمل اللغات المقيدة التي تستخدم في استرجاع الصور مكنز الفنون 
والعارة 1165811105" عطتتاءء)لطاءصة ل0صة امف وخطة تصنيف الفنون 
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والأيقونات 1.455 1201710. ومكنز المواد التصويرية عنطمة:) 10 كسناددوعط1' 
5 . ويمكن العثور على المزيد من الوصف لمذه اللغات المقيدة في راسموسن 
(1997) معودتاموكج18. وفي خطوة أكثر تقدما حلل جورجنسن «عك3ء1016 
(2003) خصائص هذه اللغات المقيدة (الموضوعات والبشر على سبيل المثال)» من 
حيث توزيع تكرارهاء لمساعدة المتعاملين على الإحاطة بتطبيقها على نحو أفضل. 
-كذلك تهت تجربة المكانز المرئية التي تستعمل البدائل المرثية: بالإضافة إلى التعبيرات 
اللفظية, لأغر اض استرجاع الصوره في بعض الحالات :1994 ,قكهاةه31) 
(1997 ,188550015568. وتبدو هذه الطريقة ممائلة للاستفسار بالمثال» وهو أسلوب 
للاسترجاعء نوقش بإيجاز في القسم 0/ /١‏ 7/ ” الخاص بتوسعة الاستفسارات. 


وبالإضافة إلى استرجاع الصور بناء على حيثياتهاء أو خصائصها الموضوعية» 
هناك الكثير من الخنصائص الذاتية للوصول إلى الصور الثابتة باتباع النهج القائم على 
الوصف. والتاريخ» والحجمء ونوع الصورة مجرد أمثلة قليلة. ولا تختلف عمليات 
البحث من هذا النوع كثيراء عن البحث بال حقل في استرجاع المعلومات النصية. ولا 
تزال التقنيات التي تطورت لاسترجاع المعلومات النصية (كالبحث البوليني» والبتر 
على سبيل المثال) قابلة للتطبيق في استرجاع الصور الثابتة» مع النهج القائم على 
الوصف. ويكمن الاختلاف الرئيس بين استرجاع النصوص واسترجاع الصورء في 
تعريف الحقول أو تحديد معالمها؛ فالحقول في استرجاع الصور الثابتة» يتم تحديد 
معالمها تبعا لخصائصن الصور لا وفقا لخصائص المعلومات النصية. 

ومع ذلك فإن نبج استرجاع الصور القائم على الوصفء يرث جميع المشكلات 
المرتببطة بالتدخل البشري في العملية» كعدم الاطراد والتكلفة المرتفعة. يضاف إلى ذلك أنه 
لا مفر من الذاتية ل*فاء» 505 في تفسير حيثيات الصورء وعلى درجة أكثر ارتفاعا مما 
هي عليه الحال في استرجاع النصوص؛ نظرا لأن تفسير حيثيات الصور أو محتواها 
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الموضوعي يتوقف بشكل كبيره على خبرة المرء الشخصية وخلفيته؛ فمن الممكن على 
سبيل المثال» لكأس النبيذ في صورة ماء أن يكون دليلا على الاحتفال بالنسبة لشخص 
ماء بينم هو رمز السكر بالنسبة لآخر. وقد لا تشتمل الصور نفسها على مفاتيح صريحة 
للتفسير. وقد دخل النهج القائم على المحتوى إلى مجال استرجاع الصورء جزئياء 
للتغلب على مشكلة اتباع النهج القائم على الوصف هذه. وتشمل العوامل الأخرى 
التي أسهمت في ظهور النهج القائم على المحتوى» تطور التقنيات» ونمو معلومات 
الصور في العصر الرقمي, ظ 
استرجاع الصور الثابتة القائم على المحتوى: 

يتم اتباع النهج القائم على المحتوى لاسترجاع الصور الثابتة» بمعالجة 
خصائص الصور المحددة في الاستفسارات الى. وهذه الخصائص مشتقة من محتويات 
الصورة» ومن هنا سمي هذا النهج بالنهج القائم على المحتوى. وكا بينا في 4/ ”/ ١‏ 
فإنه يمكن تقسيم خصائص الصور إلى مستويين أو طبقتين مختلفتين 8 كصفكطله8) 
(1955 وتإكاوةهصوط :1999 ,سقطد»©). إلا أن نظم استرجاع الصور باتباع النهج 
القائم على المحتوىء لا تعمل في الوقت الراهن بأقصى فاعلية: إلا في المستوى الأول 
فقطءأي الملامح البدائية للصور كاللون, والنسيج» والشكل © 5صافعلة6) 
(1999 بومسقطة": . 

والمضاهاة هي التقنية الأساس في أي عملية للاسترجاع؛ واسترجاع الصور 
الثابتة بالنهج القاتم على المحتوى ليس استثناء؛ فخصائص الصور المحددة في 
الاستفسار ينبغي أن تضاهي تلك الخصائص الممثلة في نظام استرجاع الصورء لكي 
يكون من الممكن الحصول على أي نتائج. وقد تم شرح المضاهاة الأساسء أو تقنية 
الاسترجاع بالنسبة للصور الثابتة بناء على اللون. والنسيج؛ والشكل» بوضوح 
واستفاضة في إيكنز وجراهام (1999) تصقطق) 0صة كستكلةظ؛ وإن كان من 
الممكن لتطبيقات بعينها أن تنطوي على بعض الاختلافات. 
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ويستند استرجاع الصور الثابتة باللون إلى الرسوم البيانية تصهع0)كلط 
للألوان؛ إذ يتم تحليل كل صورة يشملها النظام؛ لحساب الرسم البياني للون» الذي 
يبين نسبة بكسلات 5615م كل لون في الصورة» ثم يتم بعد ذلك اختزان الرسم 
البياني لألوان كل صورة في النظام للاستخدام في المستقبل. وبإمكان المتعامل؛ أثناء 
البحثء إما تحديد النسبة المرغوبة لكل لون ”١(‏ بالمئة أبيض» و١"‏ بالمئة أزرق» و٠4‏ 
بالمئة برتقالي» على سبيل المثال) وإما تقديم صورة كمثال (أي الاستفسار بالمشال) يتم 
منها حساب رسم بياني آخر للألوان. وبأي من الطريقتين تتم المضاهاة لاسترجاع 
تلك الصورء التي تضاهي الرسوم البيانية لألوانها تلك الرسوم البيانية للاستفسار إلى 
أقصى حد. ومن الممكن للنتائج التي يتم الحصول عليهاء من بعض نظم استرجاع 
الصور باللون» أن تبدو مثيرة للإعجاب فعلاً (1999 رنسقطه© © عصلعلة08). 

ويستند استرجاع الصور الثابتة بالنسيج إلى الخصائص النصية لهتناءء) 
كالتباين غ0215:85© والاتجاهية 'إ01561028111. وقد اتبعت أساليب متنوعة لقياس 
التشابه النصى بين الاستفسارات والصور المختزنة. فبادئ ذي بدء» تحسب هذه 
الأجاليت للمعان دكع مااع اط النسبي لثنائيات بكسلاث 15عظأم 04 5زم منتقاة 
من كل صورة: ثم يتم بعد ذلك حساب مقاييس أخرى لنسيج الصورة» كدرجة 
التباين» ومدى الخخنشونة» والاتجاهية» والانتظام (أو الدورية) والعشوائية. ومن 
الممكن صياغة استفسارات النسيج بطريقة ممائلة لتلك التي تصاغ بها استفسارات 
اللون. باختيار أمثلة من الأنسجة المرغوبة من لوحة الألوان ©81»]1م, أو بتوفير 
صورة استفسار كمثال. ويسترجع النظام صورا بمقاييس نسيج ممائلة في قيمتها إلى 
أبعد حد للاستفسار. واسترجاع الصور بالنسيج مفيد بوجه حاص في التمييز بين 
مناطق الصور ذات الألوان المتشاءبة (كالسماء والبحرء أو الأوراق والمحشائش على 
شيل اللثال): 
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وقد تناول ستكس (2006) 58# بالوصفهء تقنية ترتبط ارتباطا وثيقا 
باسترجاع الصور الثابتة بالنسيج؛ إذ يتم أولا تحليل كل صورة في نظام استرجاع 
معلومات الصورء بواسطة الحاسبات» للتحقق من الخصائص المميزة التي تتكون من 
مناطق داكنة 08816 محاطة بمناطق ناصعة 11884 أو العكسء ثم يتم بعد ذلك تجميع 
بعض الخصائص معا في مجموعات ثلاثية» بناء على حساب المسافة الفاصلة بين كل 
خاصية وأخرى. وتمثل كل خاصية النقطة المركزية وهي بقعة مربعة مكونة من ٠١‏ < 
٠‏ بكسلات. ويسمى تجميع ثلاث بقعء ثلاثية 1©4ط.ويتم اختزان مكان كل 
ثلاثية كمدخل في جدول ضخم» مصمم للحد قدر الإمكان» من كم العمليات 
الحسابية اللازمة للبحث عن أي مدخل بعينه. كذلك يتم تقسيم صورة الاستفسار إلى 
ثلاثيات. بطريقة ممائلة لتلك الخاصة بتجهيز الصور المستهدفة. ويتم في النهاية 
مضاهاة ثلاثيات صورة الاستفسار مقابل تلك الثلاثيات الموجودة في الجدول. في 
أثناء عملية الاسترجاع. 


ويستند استرجاع الصور الثابتة بالشكلء إلى شكل الشيء أو الموضوع. إلا أنه 
مستقل عن الحجم أو الاتجاه؛ إذ يتم حساب عدد من الخصائص المرتبطة بشكل 
الموضوعء لكل موضوع يتم التحقق منه. في كل وثيقة مختزنة. وهناك نوعان رئيسان 
لخصائص الشكلء عادة ما يستخدمان: )١(‏ الخنصائص العامة أو الشاملة 81081 
5"ناطقع كنسبة العرض إلى الارتفاع والدائرية» (؟) الخصائص الموضعية 10681 
كمجموعات القطاعات الحدودية المتوالية. والاستفسارات التي تقدم لنظم 
الاسترجاع بالشكلء إما أن تكون نماذج صور أو مخططات يرسمها المتعامل مع 
النظام. ويتم الرد حينئذ على الاستفسارات» بحساب مجموعة المخصائص نفسها 
الخاصة بصورة الاستفسار» واسترجاع تلك الصور المختزنة التي تضاهي خصائصهاء 
تلك الخصائص الخاصة بالاستفسار إلى أبعد حد. 
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ويبدو النهج القائم على المحتوى» باللون والنسيج والشكل» قادرا على تقديم 
نتائج مفيدة» على الرغم من أن بعض الخصائص قد أثبتت أنها أكثر فاعلية من غيرها 
بكثير (1999 ,تسقطة:© يت كصأكلة0. ومن المسلم به بوجه عامء أن استرجاع اللون 
واسترجاع الملمس» يسفران عن نتائج أفضل من مضاهاة الشكل © ,3ه8210150) 
(1994 ..31. إلا أن الشكل مفهوم واضح المعالم بها فيه الكفاية» ومن السهل التعرف 
عليه في التحقق من الموضوعات الطبيعية الكامنة في الصور. ويكمن جزء من المشكلة 
بالنسبة لمضاهاة الشكل» في صعوبة التمييز آليا بين أشكال الصدارة 0سدامموء10 
وتفصيلات الخلفية 54ا70عء621 في الصورة الطبيعية. وقد طورت جماعة البحث في 
الاستفسار بمحتوى الصورة (011)0) 24ع1ه00) ع15088 01123::83)). على سبيل 
المثال» بعض طرق التصدي هذه المشكلة (1995 ,.[ه اء ,تعصعكء811). 

ويعد استرجاع الصور القائم على المحتوى عمقتطذ 0عكدط-معامه) 
(08118©) 1هوعتناعم, على المستويات العليا أو الدلالية» على الرغم من عدم إمكان 
إجرائه على نحو مرضي في الوقت الراهن- مطلبا من جانب المتعاملين. وتتوققف 
الاختراقات في هذا المجال أيضا إلى حد بعيد على التطورات التي تتحقق في بحوث 
الذكاء الاصطناعيء أي أنها يمكن أن تتم عندما تتمكن الحاسبات فعلا من محاكاة 
المهام الفكرية للعقول البشرية. ولا يزال استرجاع الصوره بناء على الخصائص 
الدلالية أو الموضوعية» بحاجة لتدخل البشر» الأمر الذي يدل على عام إمكانية 
الاستغناء عن النهج القائم على الوصف في الوقت الراهن. 


تكامل نهجي استرجاع الصور: 


يتعامل النهج القائم على المحتوى مع خصائص الصور التي يمكن تجهيزها 
آلياء إلا أنه لا يعمل الآن بفاعلية» إلا مع الخصائص الأولية للصورء كاللون» 
والشكلء والملمس (1999 ,0هطة© © قصاأكلة). ولا يمكن معالجة المستويات 
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:العليا لخصائص الصورهء التي سبقت مناقشتهاء بنجاح لأغراض الاسترجاع؛ نظرا 
لأن الحاسبات لا تزال غير قادرة على إنجاز التحليل الذكي للصور. يضاف إلى ذلك 
أن نبج استرجاع الصور القائم على المحتوىء أحيانا ما يفشل على نحو مؤسف ,811) 
(2006. وفي مقابل ذلك» يمكن للنهج القائم على الوصف. معالحة المستويات العليا 
أو الدلالية لخصائص الصورء بالتحقق من الصورء وما تتضمنه من موضوعات» 
ووصفها يدوياء من حيث ماهيتها وما تمثله. إلا أن مضاهاة الخاصية الأولية (كالشكل 
المعين لسقف مبنى ماء على سبيل المثال) التي يمكن أن تتم بيسر في استرجاع الصور 
القائم على المحتوى» يمكن أن تكون مهمة غير عملية» في النهج القائم على الوصف. 
ولكل نبج سياقه الواضحء وله أيضاً مظاهر قوته في استرجاع الصور (2001 ,11©). 

وينمو البحث في استرجاع الصور ويتسع؛ وخصوصا في المجال القائم على 
المحتوى. ويبدو هذا النهج القائم على المحتوى» وهو أحدث النهجين» مستخدما في 
مشروعات البحثء على نحو أكثر كثافة واتساعا من النهج القائم على الوصف 
(2001 مناط)). إلا أن النهج القائم على الوصف يظل هو الخيار الأولء بالنسبة للنظم 
العاملة فعلا (1999 وتطهط2)). على سبيل المثال). 


وتزداد الحاجة إلى تكامل كلا النهجين وضوحا بمرور الوقتء وإلى أن يتم 
التوصل إلى وسائل للتجهيز اللي للمحتوى الدلالي للصور (1992 ,08::[21). وكان 
إيكنز وجراهام (1999) تسقطة؟© 0طه كسأء لوكلا اللذان يسميان النهج القائم على 
الوصف بطريقة الكلمات المفتاحية» يعتقدان أن استعمال الكلات المفتاحية وخخصائص 
الصور معاء يمكن أن يثبت جاذبيته. وقد سجلا عدة أسباب لاقتراحهما؛ أولما أن 
الكلمات المفتاحية يمكن أن تستعمل لالتقاط المحتوى الدلالي للصورء بينما يمكن 
لمضاهاة الخواص الأولية أن يكمل ذلك على نحو عمليء بالتحقق من خواص الصور 
(اللون أو الملمس على سبيل المثال) التي يصعب تسميتها باتباع بج الوصف. ثانياء 
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من الممكن إحراز أرصدة نقاط مرتفعة للتحقيق والاستدعاءء» عندما يتم» على سبيل 
المثال» استعمال تشابه النص واللون معاء أرصدة أعلى مما يمكن إحرازه عند استعيال 
أي منهما مستقلا. ثالثاء يمكن للاسترجاع بمجموعة من الطرقء باتباع بنى أو نظم 
معرفية مختلفة» أن يكون أكثر فاعلية ما يمكن أن يتم بأي طريقة بمفردها 
(1996 وهعء5ء12859). ويسمى إنزر (2008) «تعوصطا هذا النهج المتكامل 
بالاسترجاع الدلاالي لمعلومات الصور. 

وقد حاول بعض الباحثين المنتمين إلى أوساط الاسترجاع القائم على المحتتوى 
فعلاء دمج المعلومات النصية والدلالية مع الخصائص البصرية للصور» في بحوثهم؛ 
الأمر الذي يدل على بداية واعدة لتكامل النهجين (2001 ,111©). كذلك نشرت في 
السنوات الأخيرة» تقارير تربط بين نجي البحث المختلفين (مثل ..[0 أ ول:تقصعدظ 
19976 .81 أء بقصقط© :2003). وفضلا عن ذلك أشار إيكنز وجراهام كهاأعاة15 
(1999) سقطةق»© لصة في دراستهماء إلى أن الحواجز بين أوساط البحث المختلفة 
في المجال» تتهاوى تدريجيا. ومن الممكن لتكامل النهجين أن يحقق وصولا أفضل 
وأكثر كفاءة للصور الثابتة» وكذلك الأنواع الأخرى من المعلومات متعددة الوسائط. 


استرجاع الأصوات: 

تشمل الأصوات, التى تسمى أيضا بالسمعيات» الموسيقى غير اللفظية 
والحديث اللفظى. بالإضافة إلى الأصوات الطبيعية أو الاصطناعية الأخرى (كتغريد 
الطيور وضوضاء المرور على سبيل المثال). والموسيقى وا لحديث هما النوعان الرئيسان 
للمعلومات التي يتم استكشافها في استرجاع الأصوات. 

وقد أصبح استرجاع المعلومات الموسيقية (8/1118) 11 عأوس3 تدريجياء مجالا 
متميزا للبحث؛ حيث نجد الآن ورش العملء واللجان, والمؤتمرات المكرسة خصوصًا 
للموضوع (2003 يعثط*000. وكذلك اللغة, أحد المكونات الأساس لاسترجاع 
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المعلومات» فإن للموسيقى معنى مستتر. إلا أن الموسيقى ربم| تكون أكثر تعقدا من 
اللغة؛ إذ أن أي أداء لها يضيف طبقة من التعقد (2002 ,150141مم1.1). وللموسيقى 
دلالتها الخاصة» ويمكن للحن أن ينقل معنى قد لا تكون الكلمات قادرة على التعبير 
عنه. وكم| هو الخال بالنسبة للصورء يمكن للمقطوعة الموسيقية أن تفسر على نحو 
مختلف. من جانب ذوي الخلفيات المختلفة» وفي المواقف المختلفة. وفضلا عن 
السمات الموسيقية كالملحن» والأسلوبء والمؤدي» التي تستخدم في استرجاع 
المعلومات الموسيقية سيقية القائم على الوصف. للموسيقى خواص فريدة (كالنغمة 12ع]أم» 
والتناغم أو التوافق '881320103» والحرس 316ص على سبيل: المثال)» التي تستند إلى 
أي نوع من استرجاع المعلومات الموسيقية فية القائم على المحتوى» يتم تطبيقه. 
الالأة ابحط جا لجار ماك !رسي وراجب قز حاعية ان أي 0ن عجان 
الاسترجاع؛ نظرا لطبيعة المعلومات الموسيقية نفسها :2002 ,0585100) عت 80) 
(2003 رع1ن12059. 


والحديث أو الخطاب [©©506. شكل للاتصال أكثر ثراء من النص التحريري 
أو المكتوب», من نواح عدة» نظرا للمكون الصوتي الإضافي. فمن الممكن على سبيل 
المثال الجرس 501130 الصوت 70106 أن يساعد في تحديد هوية المتحدث ,0ئدة0) 
(2000. وغالبا ما يسمى الحديث أو الخطاب. بالوثائق الناطقة 8ع016م5؛ فنشرات 
الأخبار» ومحادثات المؤتمرات» والمحادثات الهاتفية» من أمثلة الوثائق الناطقة. ونظرا 
لعدم إمكان انتزاع زيد 060تصأءاة المعلرمات الصوتية أو مسحها أو تدقيقها 
0عقصةءة أثناء عملية الاسترجاع؛ يتعين على الإنسان أن يستمع إليها من البداية إلى 
النهاية» عند محاولة العثور على مكان جزء بعينه. ويستغرق الاستاع إلى حديث أو 
خطاب ماء بوجه عام؛ وقنا أطول بكثير نما يستغرقه تدقيق النص أو مسحه. 
وتاج الملرهيات لمعيو ولاتطاك إل ارق امبتترجا اتلد عن حرق 
سترجاع النصوص. 
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استرجاع المعلومات الصوتية القائم على الوصف: 

لقد كان النهج القائم على الوصف. هو الطريقة الوحيدة لاسترجاع المعلومات 
الصوتية» قبل ظهور النهج القائم على المحتوى. فبإمكان الإنسان البحث عن 
الموسيقى باللحنء أو الأسلوبه أو الأدوات المستخدمة؛ وربما أيضا بموظوع 
الموسيقى» على سبيل المثال (2005 وك[5عر1). ومن الممكن استرجاع معلومات الحديث 
أو الخطاب» من بين نقاط وصول أخرىء بالمتحدث,. والمكان» والتاريخ» والوسائط 
التي سجل عليها الحديث» وموضوع الحديث. والمشكلات الرئيسة في اتباع النهج 
القائم على الوصف. لاسترجاع المعلومات الصوتية» هي الوقت والدقة. ونظرا لأن * 
المعلومات الصوتية غير قابلة للتصفح؛ فإن الأمر يستنفد الو قت إلى أقصى حد. 
لإعداد توصيفات حول المعلومات الصوتية لأغراض الاسترجاع. وإذا كانت سهات 
المعلومات الصوتية تنقسم إلى فئتين» هما الذاتية 255 والموضوع 25010655» فإن 
موضوع المعلومات الصوتية» | هو ا حال بالنسبة لأي نوع آخر من المعلومات» من 
الصعب على الإنسان الحكم عليه أو الفصل فيه بدقة. ويبدو ذلك حقيقة واقعة على 
وجه الخصوصء بالنسبة للمعلومات الصوتية غير اللفظية» كالموسيقى التي قد لا 
تكون قد قصدت للتعبير اللفظي. 
استرجاع المعلومات الصوتية القائم على المحتوى: 

يستعار البحث حول استرجاع الموسيقى القائم على المحتوى» من ثلاثة 
مجالات؛ هي استرجاع المعلومات التقليدي» وعلم الموسيقىء وإدراك الموسيقى أو 
فهمها (2002 ,41معهأصمنءآ). وتشمل السمات المشتركة التي توضع في الحسبان» في 
استرجاع المعلومات الموسيقية القائم على المحتوىء النغمة» والمدى الزمني» والتناغم» 
والجرس. وتدل النغمة على وجه التحديد, على مدى ارتفاع الصوت أو انخفاضه. 
وتتعلق المدة بمدى استمرار النوتة الموسيقية ©501. أما التناغم فيعني نغمتين أو أكثرء 
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تسمعان في الوقت نفسه» بينم| يعني الجرس نوعية النوتة الموسيقية ع8 8350) 
(2003 يعثم؟120 :2002 ,62:04050. ويتم تحليل هذه السمات آليا لأجل التحقق 
من الموضوعات الموسيقية (2002 ,.1 ]© 2قطعصفدم81). أو الوحدات المتفرقة من 
المعلومات اللحنية (2000 رعتم0) التي تصبح الآعكاترا بالسة لاسترجاع 
المعلومات الموسيقية سيقية القائم على المحتوى. فقد اقترح داوني (2000) عأم20 على 
سبيل المثال» استرجاع المعلومات الموسيقية بفترات س-جرام ونع -م (أي المسافة 
ما بين النوتات الموسيقية) التي تشتمل عليها الألحان. وتشكل س-جرامات -8 
35 (راجع أيضا 5/ )١/7 /١‏ وحدات متفرقة من المعلومات اللحنية» على 
النحو نفسه إلى حد بعيد» الذي تشكل به الكلمات الوحدات المتفرقة للغة. ومن ناحية 
أخرى تبين لبرمنجهام وآخرين (2002) .له 4 تصهطوستسصذظ؛ أن ناذج 
ماركوف!" 000615 085107 المستترة» عملت بشكل جيد في نظام استرجاع 
الموسيقى ميوزآرت 31158564 الذي قاموا بتطويره. والخوارزميات الخاصة باسترجاع 
المعلومات الموسيقية القائم على المحتوىء في الواقع أكثر عددا بكثير من الاثتتين اللتين 
ذكرتا توا. ويبدو أن هناك كثيرا من الخوارزميات الآلية لاسترجاع الموسيقىء بقدر ما 
هنالك من أعداد المتعاملين (2000 ,00019216. 
وفي نظام لاسترجاع المعلومات الموسيقية بناء على المحتوى» يتم تجهيز كل من 
معلومات مرصد البيانات والاستفسارات. باتباع خوارزمية معينة» لأغراض 
المضاهاة؛ فبإمكان المتعامل النهائي إدخال الاستفسار بالغناء أو الدندنة وستتصتصسطء 
أو باستخدام آلة موسيقية ما (2006 0م عه 102226218 ,ممقطاع ستسساظ 
على سبيل المثال). إلا أن البحث حول استرجاع الموسيقىء في مقابل البحث حول 
استرجاع المعلومات النصية» نادر» حتى وإن كانت هناك مؤتمرات سنوية (مشل 


(*) العشوائية عتأعقطء5)0. (المترجم) 
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له2337ع1 ج2410 مكمه[ عأسعطا ده مسسازوممدز5 لهصه22ع121) تعقد في 
السنوات الأخيرة» من أجل استرجاع الموسيقى على وجه الخصوص. ولا تزال النظم 
العاملة فعلا لاسترجاع المعلومات الموسيقية بناء على المحتوى نادرة الوجود. 

وني مقابل ذلك» يتضمن الإنتاج الفكري عدداً كبيرا جدا من البحوث حول 
امسترجاع المعلومات الصوتية القائم على المحتوى (مثل #6 ,تستصسل00) 
06 .21 أء روعصمل عالءنتقم5 20005 ,دعدسئتتددجغ1). ىا أنشروة مسار لاستر جاع 
الوثائق الناطقة (مسار استرجاع الوثائق الناطقة 6861 51(18) في سلسلة مؤتمرات 
استرجاع النصوص )21115 منترك -5 حتى ترك -ة9 عت ووعطممن7؟) 
(2000 ,3:34010©. والمخطوة الأولى في استرجاع الخطاب هي فصل القطاعات غير 
الصوتية عن القطاعات الصوتية. وتشمل القطاعات غير الصوتية أو المكابح الصوتية 
5115 (ا660م5. الوقائع غير الصوتية (كالتنفس المرتفع وطقطقة اللسان على 
سبيل المثال)» ومظاهر تعثر النطق أو عيوب النطق 151106865 (كالكلمات غير 
مكتملة النطق. وحالات التوقف أو التردد. والفأفأة أو التهتهة 1085)هاأوعط على 
سبيل المثال)» والعناصر أو المككونات الوظيفية (مثل و8504 وبالإضافة إلى 2ة 
0 » والموسيقى أو الضوضاء التي تغشى الصوت. وبعد إزالة هذه القطاعات 
غير الصوتية» يمكن إجراء المزيد من التحليل للقطاعات الصوتية تبعا لمختلف سمات 
الحقلات أ الدديف. ش 

وتقسيم الحديث أو الخطاب أو تحليله إلى قطاعات» خطوة تثير التحديات» إلا 
أنه لا غنى عنها في استرجاع الخطاب. وبينما يمكن نسخ أو تحويل التدفق المستمر 
لمعلومات الحديث مباشرة» دون أي تحليل مسبق» فإن التحليل يكفل عدة مزاياء 
بالمقارنة با لحل المستقيم المباشر 5]31812140159870؛ إذ من الممكن أولا اقتطاف 
معلومات مهمة (كالفصل بين المتحدثين» والتحقق من هويات المتحدثين على سبيل 
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المثال) أثناء التحليل. ثانياء يمكن للتحليل للمسبق أن يؤدي إلى تجنب المشكلات 
الناشئة عن الانقطاع اللغوي أو الفجوة اللغوية عنذما يتغير المتحدث. ثالثا يحد 
'استبعاد القطاعات غير الصوتية» وتقسيم البيانات إلى قطاعات أقل طولاء من وقت 
إجراء العمليات الحاسبية على نحو ملحوظء كا يبسر فك الشفرات في مرحلة لاحقة 
(2000 ,4009 © اعصدمآ 2211135 . 


وقد تم تطوير خوارزميات عدة. للتعرف على الحديث وفهم الحديث. 
والتعرف على من يتحدث مشكلة مختلفة قليلا عنن التعرف على ما يقال وكاأوع.آ) 
(2005. ويتوقف الإلمام بالحديث على فهم الحديث؛ الذي يعتمد أكثر على معالجة 
اللغة الطبيعية (3/1.1)» وهو موضوع نناقشه في الفصل الثاني عشر. فالنغمة» 
والسرعة. والكثافة (أي التوقف بين الجمل أطول من التوقف بين الكلمات) من بين 
السمات التي عادة ما تستخدم لاسترجاع الأصوات. وفضلا عن ذلك يستخدم نوع 
المتحدثء وإحصاءات استعمال الكلمات, والكلمات المفتاحية التي تميز كل فئة» وذلك 
بالارتباط مع مفردات اللغة التي تنشأ على وجه التحديد من أجل الإلمام بالحدث 
وفهمه 20005 وتروع1 114151140 511 ع1 :2000 ,له اء مقلهطتكل) 
(2000 .21 أء ,758)185. كذلك تستخدم أساليب الاسترجاع التقليدية» كالوزن 
أيضا في استرجاع الحديث (1996 ..[2 ]© ,70065 كلء«:قم8). إذ يتم تحويل الحديث 
آلياء بإنشاء النص المقابل الذي سيستخدم للمضاهاة أثناء عملية الاسترجاع. ومن 
الممكن تقديم الاستفسارات في شكل حديثء إذا ما توافرت تقنية للتعرف على 
الحديث لدى الطرف الخاص بالبحث. 

وكيا ذهب لسك (2005) عاوعرآء فإن هناك أربعة عوامل أو محددات تؤدي 
بقوة إلى صعوبة التعرف على الحديث: 
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ىم 


التمرازية المحدية: فاتقيررق التوافتل أو اسن اصع فى قهسة مين 


الحديث الذي يتم فيه التوقف بين الكلمات والجمل. 


. عدد المتحدثين: إذا كان الأمر يتطلب التعرف على جميع المتحدثين المشاركين في 


الحديث. فإن المهمة يمكن أن تكون أصعب مما هى عليه في حالة ما إذا كان 


. محتوى الحديث: يمكن لمحتوى الحديث أن يتراوح بين أي شيء بلا موضوع 


محدد» وموضوع معين بمفردات لغوية محددة على نحو جيد» ك| أنه من الأيسر 
بمكان إنجاز التعرف على الحديث في الحالة الأخيرة» ثمايمكن أن يتم في 
الحالة الأولى. 


. بيئة الحديث: : هناك احتاللات كثيرة بالنسبة لبيئة الحدي يث؛ فمن الممكن من 


ناحية» للمتحدث أن يستعمل مكبرا جيدا للصوت في غرفة هادئة (كحديث 
المؤتمر على سبيل المثال»» وعلى الجانب الآخر يتحدث المتحدث في شارع 
صاخبء بدون مكبر صوت جيد (كالمقابلات في المواقع على سبيل المثال). 
والبيئة الأولى هي المثالية بالنسبة للتعرف على الحديثء بين الثانية ليست 
كذلك. 


وبالإضافة إلى هذه العوامل الأربعة» يمكن للهجة المتحدث أن تضيف إلى 


تعقد التعرف على الحديث أيضا. 


استرجاع الصور المتحركة: 


ان ا د ا 


والأصواتء الذي نوقش توا؛ فمن الممكن للصور المتحركة التي تتكون من الصور 
ا أن تكون مصحوبة بالصوت أو غير مصحوبة 
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بالصوت. وأشرطة الفيديوء والأفلام السينائية» والبرامج التلفزيونية» من أمثلة 
الصور المتحركة المصحوبة بالصوتء بين) تمثل الرسوم المتحركة أو الأفلام الصامتة» 
الصور المتحركة بدون صوت. 

وقد اتبع النهج القائم على الوصف فى استرجاع الصور المتحركة. وتشمل 
التوصيفات الخاصة بالصور المتمركزة جوانب مثل المخرج السينائي» وسنة الإنتاج. 
تلك الجوانب التي عادة ما يتم اختيارها للتعبير عن الخواص الذاتية والموضوعات. 
إلا أن استرجاع الصور المتحركة باتباع هذا النهج» عرضة للمشكلات نفسها 
(كالتكلفة المرتفعة والكفاءة المنخفضة على سبيل المثال) التي غالباً ما تكتنف استرجاع 
الأنواع الأخرى من المعلومات متعددة الوسائط. 


وينطوي استرجاع الصور المتحركة: باتباع النهج القائم على المحتوى؛ 
بالضرورة؛ على ثلاث مهام رئيسة» وإن كان من الممكن إجراء الاسترجاع ببعض 
الأشكال المختلفة. والمهمة الأولى هي ععزل المكون الصوتيء إذا كان هناك مكون 
صوتيء عن الصورة المتحركة؛ وتجهيز المعلومات الصوتية. والمهمة الثانية هي تقسيم 
الصور المتحركة إلى صور ثابتة وفقاً للقطات أو أي سمات أخرى. والمهمة الثالثة هي 
تجهيز الصور الثابتة. وبعبارة أخرىء فإنه من الممكن لاسترجاع الصور المتحركة:؛ أن 
يختزل إلى استرجاع الصوت والصورة الثابتة. ويكمن مايميز استرجاع الصور 
المتحركة فعل» عن استرجاع الصوت والصور الثابتة» في تجزئة الصور المتحركة. 
ونظراً لأننا قد تناولنا استرجاع الأصوات واسترجاع الصور الثابتة في الأقسام 
السابقة؛ فسوف تركز هذه المناقشة على تجزئة الصور المتحركة لأغراض الاسترجاع. 

فالصور المتحركة ينبغي أن تجزأ أو تفككء لكي تصبح قابلة للاسترجاع. 
وعادة ما تتخذ المناظر أو الوقائع وحدات دلالية» من أجل تجزئة الصور المتحركة. 
ويتم التحقق منها باكتشاف التغير في هذه العوامل» كتوزيع اللون» والملمسء والحزوز 
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كاناء» والظلال 28065, والتلاثي» وومضات الكاميراء آليا. ويتكون المنظر بدوره من 
عدة لقطات. يمكن تحليلها أيضاً إلى عدة أطر لكل لقطة. ومن ثم فإن التقسيم يمكن 
أن يتم وفقاً للمنظرء أو اللقطة؛ أو.الإطار. 

ويعرف تجزىء الصور المتحركة باللقطة. باكتشاف أطر اللقطات 
راظ5) «مناءعاء0 معصعء؟ لإتملستاوط أمطة. وتقوم معظم أساتيت اكنشات 
'حدود اللقطة بحساب التشابه بين الأطر المتجاورة؛ وتمييز 188 التغير المحتمل للقطة» 
عندما ينخفض ذلك التشابه إلى ما دون حد معين (2004. ,58062608). وتعمل هذه 
الأساليب بشكل مناسب إلى حد معقولء إذا كان بالصور المتحركة حدود لقطات 
واضحة. بحيث يرد الإطار الأول للقطة الجديدة بعد الإطار الأخير من اللقطة 
السابقة مباشرة. إلا أن كثيراً من الصور المتحركة تنطوي على تحول تدريجى من لقطة 
أن ى (كحالات التلاشي الداخلي وحالات التلاشي الخارجي؛ وحالات الذوبان» 
والمظاهر الخارجية 15م820» والرتوش أو اللمسات 65م1 على سبيل المثال» لجعلها 
أكثر متعة من الناحية الالية. إنها مثل هذه المؤثرات التجميلية في الصور المتحركة» 
التي تتحدى سهولة اكتشاف حدود اللقطات. وفي مقابل ذلك» ميل بعض أساليب 
اكتشاف حدود اللقطات (كاكتشاف الحواف على سبيل المثال) لأن تتعامل مع 
التحولات التدريجية بشكل مناسبء إلا أنها من المرجح أن تسفر عن صور موجبة 
خادعة في اللقطات الخافتة أو البعيدة عن التركيز (2004 ,84098عجم8) . 

وكا سبق أن لاحظناء فإن اللقطة تتكون من أطر مجمعة معاء بناء على بععض 
السمات المشتركة. ويسمى الإطار الذي يمثل كل لقطة الإطار الرئيس عتدصه؟الزءء1. 
ويعني اختيار إطار رئيس» العثور على الإطار الذي يمثل المجموعة المتوسطة. من 
الأطر في اللقطة على خير وجه. ويمكن للإطار الرئيس أن يكون في بداية اللقطة:؛ أو 
فى نهايتهاء أو في أي موضع متوسطه إلا أنه لم يتم حتى الآن إجراء دراسات لتحديد 
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أي أساليب اختيار الإطار الرئيس أكثر نجاحاً في التطبيق (2004 ,87068408)» غير 
أنه غالباً ما ينظر إلى اختيار الإطار الرئيس بوصفه ””مهمة مغلقة ]5ه ع19ط", 
وتنطوي أكثر الطرق شيوعاً على اختيار الإطار الرئيس من منتصف اللقطة. 
ومن الممكن بعد ذلك؛ وضع مجموعة من الأطر الرئيسة معاً لتتشكل القصة 
المصورة 560290590830 للصور الثابتة الموضحة أو الشارحة» لتمثيل كل مشهد. وعلى 
الرغم من أن التجميع الآلي للقطات في مشاهد منطقية» عن طريق الأطر الرئيسة» 
يحظى الآن بقدر كبير من الاهتمام فقد أثبتت الجهود من هذا النوع صعوبتهاء إلا في * 
المجالات المنضبطة تنظيمياً للصور المتحركة (كنشرات الأخبار التلفزيونية» التي عادة 
ما تنطوي على الأفراد العاملين بالربط» والأرصدة التمهيدية» وسلسلة القصص 
المتفرقة). وبالإضافة إلى طريقة الإطار الرئيس» يستخدم أسلوب انتزاع زيد 
عستسدم ءا الفيديو لإنتاج سلسلة من مقاطع الفيديو القصيرة, التي يتضمن كل منها 
التفصيلات الأساسية لتتابع واحدء أو سللسلة من اللقطات ذات الدلالة اللغوية 
(1999 وتطقطة:) © كسفتكلة5). وتشكل تلك الكيانات»ء الأساس بالنسبة 
. لاسترجاع الصور المتحركة. وعادة ما يوفر تتابع الصور المتحركة معلومات أكثر تما 
توفرها الأطر الرئيسة» لأغراض الاسترجاع. ومن الممكن للصور المتحركة نفسهاء أن 
تكون بمثابة استفساراتء إذا ما كانت مقاطع الفيديو القصيرة مقتطفة. ومتاحة في 
نظام استرجاع المعلومات. فالاستفسار بالمثال المتحرك من الحالات الجديرة بالاهتمام 
(1997 .1ه اء وصسقطن) . 
وهناك نبج آخر ربم| يكون الأبسط والأكثر شيوعاء وهو مضاهاة نص 
استفسار المستفيد» مقابل تسجيل خطي من المحتوى الناطق المقتطف من الصورة 
المتحركة. وفي استرجاع الوثائق الناطقة» يمكن لهذا الأسلوب أن يظل فعالاً إلى حد 
بعيد» حتى وإن كان معدل الخطأ في الكلمات في حدود 6٠‏ بالمثئة أء وعهمل كاءرقم5) 
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(1996 ,.81. ومن بين مضامين نتيجة عملية البحث هذه؛ أن يبدو استرجاع الصور 
المتحركة بناء على الحديث الذي يتم التعرف عليه واعداً. وأفضل مثال لنظام استرجاع 
الفيديو الذي يدعم البحث بالنسخة الخطية» أو البحث عن طريق العبارات الجاذية 
المغلقة» هو علامة الطريق» التي تطورت في مشروع مكتبة الفيديو الرقمي إنفورميديا 
 )99379777+ 110113...‏ 7لةناطارا[ 17100 لهالعواطط دتلعمنمكم؟1) 
بجامعة كاري ينجي ملون ع# تتمهنسامة]8) كنوت عتمنا سمللتلة عتوعصممن) 
(1997 ,400616 ف/اآ. وأحياناً ما يكون من الممكن استعمال المعلومات الصوتية التفي 
تتضمنها الصور المتحركة» للتخلص من الغموض في تجزىء وتفسير الصور المتحركة. 
والعكس صحيح فيا (2000 .له أ وتتقلاعه؟17). 

وربما يتبين لنا من هذه المعالجة الموجزة أن التجزىء الآلي للصور المتحركة» 
ليس بالمهمة اليسيرة؛ فالتجزىء عملية معقدة متعددة الخنطوات. فالفيديو على سبيل 
المشال» يمكن أن يتكون أولاً من القصة. ثم من الأحداث واللقطة والإطار 
(2004 ,52262602 20005 ,50ألرء171اعت دصل1ع60). وبينا يبدو التجزىء باللقطة 
والإطار مباشراًء فإن التجزىء بالقصة والأحداث يتطلب جهوداً بشرية» أو ذكاء 
اصطناعياً. وهذا مبرر آخر لضرورة الجمع بين النهج القائم على المحتوى والنهج 
القائم على الوصف. في استرجاع الوسائط المتعددة» في ظل الوضع الراهن لتقنيات 
الاسترجاع (2008 ,ناأنآ عق 917735). 


استرجاع الوسائط المتعددة على الإنترنت: 


اشتهرت عنكبوتية الإنترنت بقدرتها على تداول المعلومات متعددة الوسائط. 
ومن ثم فإن عدداً كبيراً من نظم استرجاع الإنترنت (جوجل على سبيل المثال) يدعم 
البحث في الوسائط المتعددة» سواء كانت هذه النظم وحدهاء أو بالتعاون مع 
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الشركات المتخصصة في إدارة معلومات الوسائط المتعددة؛ على نحو يكفل للمستفيد 
النهائي الوصول إلى ثروة الوسائط المتعددة على العنكبوتية: 

وهناك ثلاث طرق مختلفة قائمة على الوصف. في متناول المستفيدين النهائيين» 
تسترجع معلومات الوسائط المتعددة من العنكبوتية: 

.١‏ بالكلمات المفتاحية: إذ يستطيع المستفيدون استرجاع معلومات الوسائط المتعددة 
بالكلات المفتاحية» تماما ىا يفعلون في بحث المعلومات النصية. وتعمل هذه 
الطريقة بكفاءة على وجه الخصوص: في المواقع المخصصة لعمليات البحث عن 
الصورء مثل بكسيرش تاعنتوع21 (مدوع.تاء توعسع لم 893 ). 

؟. بنوع الوسائط المتعددة: فالوسائط المتعددة اسم جامع لمختلف أنواع 
المعلومات غير النصية» كالصورء وتسجيلات إم بي ثري 1183 والفيديو. 
ويمكن لأنواع الوسائط المتعددة هذه أن تكون بمثابة نقاط وصول في عملية 
الاسترجاع. وتستخدم بعض نظم استرجاع الإنترنت (مشل ألتافيستا 
115 4) أزرار المذياع» أو تقنية أخرى ماثلة» ليختار بها المستفيديون النوع 
الذي يودون استرجاعه من الوسائط المتعددة. 

*”. بامتداد اسم الملف: فعادة ما تكون لأساء الملفات في البيئة الرقمية» ما يصل 
إلى ثلاثة أحرف في امتداد ملفهاء لتحديد نوع الملف. وفي حالة ملفات 
الوسائط المتعددة» فإن 8117 و8مل» على سبيل المثال امتدادات عادية للملفات» 
بالنسبة للصور الثابتة. وعادة ما تنتهي أساء الملفات» الناطقة ب 3ه أو 8735 
أو 5223. أو ما شابه ذلك» وتشمل امتدادات أساء الملفات بالنسبة للصور 


المتحركة 8 و122078. ومن الممكن تضمين امتدادات أسماء الملفات هذه في 
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الاستفسارات» وذلك لاسترجاع نوع معلومات الوسائط المتعددة المحدد 
(مثل كأع.1لة65قعمع كاستفسار للبحث). 


والنهج القائم على المحتوى متاح أيضاً على الإنترنت» لاسترجاع معلومات 
الوسائط المتعددة. وتدعم بعض نظم استرجاع الإنترنت» كلا النهجين؛ فبإمكان 
المتعاملين» على سبيل المثال؛ بدء عملية بحث ما بنهج الكلمات المفتاحية القائم على 
الوصف. ثم يي البحث بالسمات القائمة على المحتوى» كاللون والشكل على 
سبيل المثال. ويكفل بحث الصور في 18318.02 للمتعاملين» الحصول على المزيد من 
الصور الماثلة للصورة المسترجعة. باستعمال الكلمات المفتاحية» وذلك بالنقر بيساطة 
على رابطة "المزيد من الصور الماثلة قعققصططا تقلتصيئة ععمص" ,ماسيهحطءه) 
(2008. والنظم الأخرى مصممة للتعامل فقط مع استرجاع معلومات الوسائط 
المتعددة, القائم على المحتوى. إلا أن النظم من هذا النوع (مثل لهد715؟ و'متعومه0©) 
35 ؟18)5169211) تتاح للمتعاملين مع الإنترنت» عندما تكون النظم في مرحلة 
الاختبار التجريبي ]165 5612 فقط. وبمجرد انتهاء الاختبار» تصبح هذه النظم تعمل 
بمقابل رسوم. ولا تتاح في النطاق العام. ويمكن لنظم أخرى أن تتوقف عن العمل 
نظراً للافتقار إلى الترويج أو الإدارة المناسبة. 

واسترجاع معلومات الوسائط المتجددة على الإنترنت: في سبيله لأن يصبح 
أيسر مما كان عليه من قبل. ويرجع الفضل في ذلك إلى التطورات التقنية» وجهود 
الباحثين. إلا أن استرجاع الوسائط المتعددة بوجه عامء لا يزال أمامه شوط طويل» 
حتى يحقق الأداء المرضي. وقد لخص لسك (2005) ع1و©.1 يوما ما الوضع الراهن 
للمعرفة في استرجاع الوسائط المتعددة على النحو التالي: 
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بإمكاننا تصنيف الصور 5ع:161111م على وجه التقريب إلى 
حد بعيد» وفقاً للون والملمس والشكلء ولا يكفي ذلك للتعامل 
مع مجموعات ملايين الصور الضوئية. وبإمكاننا تحقيق التعرف 
على الصوت. بطريقة تكفي تماما لأن يكون هذا التعرف مفيدا إلى 
حد ماء في تحليل التسجيلات الصوتية» ولدينا تقنيات محددة 
لبحث الموسيقى. ولدينا حيل متعددة لضغط الفيديو وتصفحه. 
إلا أنه ليس لدينا سوى تقنيات محدودة للبحث فيه (0.115). 


معلومات النصوص الفائقة والوسائط الفائفة: 

يعني صدر الكلمة أو البادئة “«عملاط في ناموط ”“الامتداد إلى أبعاد أخرى 
أو تعدد الأبعاد'' (1997 ,60:2[10©). وبذلك المعنى يتكون النص الفائق 
ألاء1أ مط من نقاط ارتكازية 2005 من المعلومنات» وروابط بينهاء في فضاء متعدد 
الأبعاد. والوسائط الفائقة 65706018منؤط كذلك أيضاًء من حيث المفهوم والبناء. إلا 
أن الوسائط المتعددة لا تشمل النصوص فحسب: وإنها تشمل أيضاً معلومات 
الصوت والصورة. 

بيد أن كلا من النصوص الفائقة والوسائط الفائقة؛ تختلف عن النصوص 
والوسائط المتعددة من النواعحي التالية؛ فالنصوص الفائقة والوسائط الفائقة» تتخذ 
أولا شكل الشبكة:؛ لا التكوين الخطي المسطح للنص والوسائط المتعددة. ثانياء هناك 
الروابط التى تربط بين النصوص الفائقة والوسائط الفائقة مادياء بين) الروابط بين 
الوثائق غير فائقة البنيان 70ت6عن)5أم/إطمهه مجرد روابط مفاهيمية. ثالثاء يتم 
وضع الروابط بين الوثائق فائقة البنيان 0©نااعنا:)كمأملاط من أجل المستفيد» بين| 
يتعين على المستفيد أن يعد الروابط بين الوثائق غير فائقة البنيان» حسبا تقتضي 
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الضرورة. وتفضي المخنواص الفريدة للنصوص الفائقة والوسائط الفائقة؛ إلى طرق 
جديدة لاسترجاع المعلومات. في البنية فائقة ئقة التنظيم. 

ويمكن للتصفح, لا البحث أن يكون النهج الرئيسء الذي يتبعه المتعاملون في 
0 النصوص الفائقة والوسائط الفائقة؛ نظراً لأنه ىا بينا في 5/ ”/ ”» فإن البيئة 

تقة البنيان تشجع أنشطة التصفح. وتتوافر نقاط الوصول أو مصطلحات الاستفسار 

كأسماء 0 فائقة» في عملية الاسترجاع هذه» بحيث تستبعد حاجة المتعامل لأن 
يختارها بنفسه. وقد يبدو اختيار مصطلحات البحث سهلاً بالنسبة لاختصاصي 
المعلومات المتمرس. إلا أنه بالسية للسكيد النهاني ننهمة ته عطلت الككير: 
' وتنطوي على تحليل للمفاهيم» والنظر في أوجه الاختلاف بين الملصطلحات. يضاف 
إلى ذلك قدرة المستفيد على التحرك تلقائياً في فضاء استرجاع المعلومات متعدد الأبعاد 
هذاء بمجرد النقر على الروابط الفائقة» التي تربط بين مختلف النقاط الارتكازية 
للمعلومات. وعندما يقع الاختيار على البحث» كنهج للاسترجاع؛ فإن أسماء الروابط 
لراك اقح اواك العادرا وار اراي ملت انا لا رت 
تقنية الترتيب الطبقي. فكثير من نظم استرجاع الإنترنت؛ على سبيل المثشال» تضع 
مرح مسار و امرك تهاب واد يبان ايمر 
يضاهي اسم رابطة تتضمنه الوثيقة. 

ومن ناحية أخرىء؛ يكتنف استرجاع النصوص الفائقة والوسائط الفائقة. 
بالتصفح مشكلات محتملة» نظراً للبنيان الفائ ثق. فمن الممكن أولأء للمتعاملين أن 
يضلوا طريقهم في الفضاء الفائ تق» عند التصفح باتباع الروابط الفائقة ثقة ببساطة. ثانياً 
يمكن للمتعاملين أن يجدوا من الصعب إلقاء نظرة عامة على المعلومات التي يبحثون 
عنها؛ نظراً لأن انتباههم يمكن أن ينصرف بسهولة» نحو كثير جداً من الوثائق 
الأخرى المرتبطة. ثالثء يمكن للمتعاملين أن يجدوا صعوبة في العثور على معلومات 
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معينة» حتى وإن كانوا يعرفون أن هذه المعلومات موجودة فعلا في النظام. ويمكن 
لخرائط المواقع التي تنشأ في بعض مواقع العنكبوتية» أن تساعد ني هذا الصدد. إلا أن 
هذه الخرائط لا تتوافر في جميع نظم استرجاع المعلومات فائقة البنيان» وإذا ما توافرت» 
فإنها قد لا تكون مفصلة كى| ينبغي. 

وييسر إدخال نبج البحث في البيئة فائقة البنيان» استرجاع النصوص الفائقة 
والوسائط الفائقة. ويبدو نبج البحث. في الواقع قادراً على التغلب على المشكلات 
. الثلاث التي تكتنف التصفحء كنهج لاسترجاع النصوص الفائقة والوسائط الفائقة. 
وبينم| تشسجع الوثائق فائقة البنيان على التصفحء فإن البحث يمكن أن يتغلب على أي 
مشكلات استرجاع» ترتبط بالتصفح في الفضاء الفائق. ومن ثم يبدو التكامل بين 
نجي البحث والتصفح. أفضل سبيل لاسترجاع النصوص الفائقة والوسائط الفائقة. 
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الفصل العاشر 
المستفيد طرفا في تنظيم المعلومات واسترجاعها 


المستفيد عامل حاسمء ينبغي وضعه في الحسبانء في جميع أنشطة وجهود تنظيم 
المعلومات واسترجاعها؛ نظراً لأن الهدف النهائي لتنظيم المعلومات واسترجاعها هو 
تلبية احتياجات المستفيد من المعلومات: فالمعلومات» يتم تنظيمها على سبيل المشال 
بحيث يستطيع المستفيدون استرجاعها عند الحاجة إليها. وقد تم تطوير مختلف طرق 
الاسترجاع وأساليبه» بحيث يستطيع المستفيدون اختيار الملائم منهاء بناء على 
احتياجاتهم المحددة من المعلومات. 


وبعد المستفيد أو ما يتصل بالمستفيدء في تنظيم المعلومات واسترجاعهاء حيوي أيا 
كان المنظور الذي يمكن للمرء اتخاذه؛ فمن وجهة نظر مصمم النظام» على سبيل المثال» 
فإنه من أجل تلبية الاحتياجات المعلوماتية لسعفيدين: يكم بدآء نظو جبيئة المعلومنات 
واسترجاعها. وعلى الرغم من أن المتعاملين في تنظيم المعلومات اختصاصيو معلومات 
على الأرجح, يختلفون عن المستفيدين النهائيين في استرجاع المعلومات. فإنهم يتقاسمون 
معهم كثيرا من أوجه التشابه كمستفيدين في أنشطة تنظيم المعلومات واسترجاعها. 
ويعالج هذا الفصل المستفيدين واحتياجاتهم المعلوماتية» ثم يستكشف بعد ذلك النهج 
المعرفي الموجه نحو المستفيد» في تنظيم المعلومات واسترجاعها. وأخيرا نناقش التفاعل بين 
المستفيد ونظام استرجاع المعلومات» إلى جانب بعض القضايا المرتبطة بذلك: 
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المستفيدون واحتياجاتهم المعلوماتية: 

المستفيدون أفراد» لكل منهم خصائصه المميزة. إلا أنه لا يمكن ولاشك دراسة 
كل مستفيد بمفرده» لأغراض تنظيم المعلومات واسترجاعها؛ فالواقع أن الباحثين 
يقسمون المستفيدين إلى فئات» بتطبيق معايير مشتركة» كالنوع؛ والسن. والمهنة» 
والظروف الاقتصادية» والثقافة» والشخصية, والخلفية التعليمية. وبناء على هذه 
الخصائص العامة يمكننا التعرف على احتياجات مختلف الفئات على نحو أفضل» حتى 
وإن كنا ندرك أن قات المستفيد تتأثر بكثير من العوامل الأخرى أيضا (كمصاذر 
المعلومات على سبيل المثال). 

وإذا نظرنا إلى السن كمثال. فإن المستفيدين مختلفي الأعار لحم احتياجاتهم 
المعلوماتية المختلفة. فالمستفيدون في سن المدرسة, أو في ظروف العمل» بوجه عامء 
عادة ما تكون لديبم احتياجاتهم المعلوماتية بالنسبة للتعليم» أو المتصلة بالعملء بينا 
تميل الفئات العمرية الأخرى للحاجة إلى المعلومات العامة في معظم الأحيان. والمهنة 
معيار آخر للتحقق من احتياجات المستفيد؛ فالمشتغلون بالعلم على سبيل المشال» 
يشكلون عادة ما يسمى الجامعات الافتراضية 5ع01168» 915116م1 لتبادل المعلومات 
(راجع 1963 ,216 :1972 وعصة»0) على سبيل المثال) بين| يعتمد المهندسون. في 
مختبرات البحث والتطوير» على السدنة 15»مع8416ع للتواصل مع العالم الخارجي 
(راجع 1970 ,41162 على سبيل المثال). وقد استقصى شودري 51نة 000 
(1999) الاحتياجات المعلوماتية للمستفيدين» في مجالات أنشطة مختلفة (كإدارة 
الأعمال والمشروعات على سبيل المثال). وقد تم تلخيص المزيد من الدراسات حول 
سلوك المستفيدين في التياس المعلومات 105كقطء6 وصتئاءء5 ده أهسمكسصلق وهذا 
مصطلح أحدثء تبناه الباحثون في المجال ليحل محل التعبير الأقدم وهو الاحتياجات 
المعلوماتية وأوجه الإفادة» وذلك من جانب كيس (2007 ,2006) 0856). في دراسته 
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الوصفية التحليلية الضافية لمن يلتمسون المعلومات (أي المستفيدون)؛ وفقا للمهنة 
(كالمشتغلون بالعلم أو المهندسون على سبيل المكال)؛ والدور١كالمرضى‏ والطلبة 
على سبيل المثال)»؛ والجوانب الديموجرافية (كالسن والفئة الإثنية أو العرقية 
غل سبيل المال). 

ولقد أعاد العصر الرقمي» ونمو الإنترنت على وجه الخنصوصء النظر في 
تعريف المستفيدين واحتياجاتهم المعلوماتية» في عملية تنظيم المعلومات واسترجاعها 
فعلا. وهناك تزايد في جهود استكشاف خبرات البحث 6 لاماققط طاءروعءق 
وأفضليات البحث (كنوع الملف, واللغة» ومجال الشبكة» والدولة)» وسياقات البحث 
الأخرى» وذلك في البحوث المتصلة» كاسترجاع المعلومات على الإنترنت (راجع على 
سبيل المشال 2006 ,عء1605 20065 وتستهممقطء د81 عه اعم ه50 ,1لملدده؟1). و ف 
الوقت نفسه. ينبغي أن يظل المستفيد متحكى) في حدود السياق الذي يتضمنه استفسار 
البحث؛ لكل من دواعي الخصوصية؛ ولأن الخوارزميات الراهنة» قد لا تفسر السياق 
على نحو سليم في بعض الأحيان (2006 ,تقطعنة7؟ يق عاءنهوء8). ولما كان العصر 
الرقمي قد حل فعلا بكل تأكيد» وأنه قد وجد ليبقى؛ فإن احتمالات تأثير ذلك في 
أجيال المستقبل» في سبيله لأن يصبح موضوعا للبحث. وقد درس رولاندز وآخرون 
(2008) .1ه أء كقص ه101 على سبيل المثال تأثير التحول الرقمي على السلوك 
المعلوماتي. يل جوجل (أي أولئك الذين ولدوا بعد عام .)١9497‏ وتدعي الدراسة 
أنه على الرغم من أن الشباب يبدون سهولة واضحة. وتآلفا مع الحاسبات» فإنهم 
يعتمدون بكثافة على محركات البحث» ويشاهدون أكثر نما يقرأون» ويفتقرون إلى 
المهارات النقدية والتحليلية اللازمة لتقييم ما يجدون من معلومات على العنكبوتية. 

وييسر الإلمام بالمستفيدين واحتياجاتهم» أنشطة تنظيم المعلومات واسترجاعها. 
وقد أجريت أعداد ضخمة من الدراسات» لاستكشاف تأثير سات المستفيدين على 
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تنظيم المعلومات واسترجاعها في العصر الرقمي (مثل عأصعباظ :1989 رمقصسع و8 
© عضقطت :1993 .31 أء مولمستسمقاطءعهة8ة :1981 ,اعطعتمعء8 ي2008 رملطهغ1 يي 
1 ,1آع0158) بالنسبة لمن يقومون بإجراء عمليات البحث. و ..[ة أع رع8هه0ة1 
6 وآاءمدمةن) يه «منتكظ :2007 بالنسبة للمكشفين). ولقد ازدادت درايتنا 
بالمستفيد في إطار تنظيم المعلومات واسترجاعهاء ولاشك بفضل البحوث 
من هذا النوع. 

إلا أن الحاجة إلى المعلومات مفهوم غامض؛ إذ يفتقر إلى البنيان المنضبط» فضلا 
عن افتقاده للدقة وغياب التنظيم؛ وطهذا السبب أسهاه بلكن وزملاؤه آسك 45[16» أي 
الحالة المعرفية غير السوية 12207816086 01 5181 5نا28[10دمطة 0003 ,متعلاء8) 
2 ,081700[5 (#. وفضلا عن ذلك فإن للاحتياجات المعلوماتية خصائص 
أخرىء تشمل التغير بمرور الوقتء والاختلاف من مستفيد إلى آخر» والتوقف على 
البيئة. يضاف إلى ذلك أن الاحتياجات المعلوماتية» غالبا ما تظل دون إعراب عنهاء أو 
يكون الإعراب عنها بشكل غير مناسب (1999 ,لإ,ناط080198©). والواقع أن 
المستفيدين غالبا ما يجدون صعوبة في التعبير عن احتياجاتهم المعلوماتية كاملة. 
وناهيك عن التعبير عنها بدقة. وليس من غير المألوف أن تصدر العبارات التالية عن 
المستفيدين» عندما يُسألون عما يبحثون عنه: '”سوف أعرف عندما أراها“. وغالبا ما 
يجري اختصاصيو المعلومات مقابلاات مرجعية» وهي إحدى خطوات البحث الذي 
يحظى بالمساعدة» للعمل على حل هذه المشكلة. 

وفضلا عن خصائص المستفيد» تحقق بيزلي (1968) (ع1وذهط من أربعة عوامل 
أخرى تؤثر في الاحتياجات المعلوماتية للمستفيدين: 


التأثير على احتياجاتهم. وتختلف توقعات المستفيدين عندما تتوافر لهم على 
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سبيل المثال» معلومات من نظام محلي» في مقابل ما يتوافر لحم من نظام 
وطني في تغطيته. 
؟. الهدف: لأي هدف يحتاج المستفيدون إلى المعلومات؟ فإذا كان المستفيدون 
يرغبون في المعلومات لمجرد الإجابة عن بعض الأسئلة ا حقائقية (ما أعلى 
مبنى في العالم؟ على سبيل المثال)» فإن احتياجاتهم المعلوماتية تبدو بسيطة 
أو مباشرة. أما إذا كان المستفيدون يريدون المعلومات من أجل مشروع 
بحث ماء فإن احتياجاتهم المعلوماتية تدخل ولاشك في فئة أخرى. 
“. العوامل الخارجية: يمكن للعوامل الاجتماعية» والسياسية» والاقتصادية» 
وغيرها من العوامل الخارجية؛ أن تؤثر بقوة في المستفيدين واحتياجاتهم 
المعلوماتية. 
4. النتيجة: ما الحصيلة التي تعود على المستفيدين» نتيجة للإفادة من 
المعلومات؟ فمن الممكن للنتائج الإيجابية» على سبيل المثال (زيادة 
الإنتاجية مثلا)» أن تكون بمثابة مكافآت للمستفيدين» كما تحثهم على 
المزيد في ذلك الصدد. 
وقصارى القول» فإن المستفيدين أنفسهم. إلى جانب مصادر المعلومات» 
وال هدف. والعوامل الخارجية» والنتيجة» يشكلون العوامل الخمسة التي تؤثر في 
الاحتياجات المعلوماتية. وعلى الرغم من أن بحث بيزلي 881516 حول الاحتياجات 
المعلوماتية» نشر عام ».١197/‏ فإنه لا يزال صا حا اليوم؛ ونحن بصدد مناقشة الموضوع 
في سياق تنظيم المعلومات واسترجاعها رقميا. 

ولما كانت الاحتياجات المعلوماتية تتأثر بكثير جدا من العواملء» فإنه من 
المتوقع أن تكون هناك أنواع مختلفة من هذه الاحتياجات. ومن التصنيفات المألوفة» 
تقسيم الاحتياجات ال معلوماتية إلى فئتين؛ أولاهما الحاجة إلى عنصر معروفء والثانية 
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الاحتياجات الموضوعية (1993 ,تعتدهة؟7 © “اعأكهعمه.ر]آ)» وذلك بمجموعة 
أرق من المصطلحات؟؛ كالاحتياجات المعلوماتية المحددة واضحة المعالم عأ 601 
والاحتياجات المعلوماتية المرتبطة بمشكلة ما (1988 رطاونا:8 عه كاصة1). وتعبير 
الحاجة إلى عنصر معروفء والاحتياجات المعلوماتية المحددة» عن مفهومين 
متشابيين» | يصدق الأمر نفسه بالنسبة للاحتياجات الموضوعية» والاحتياجات 
المعلوماتية المرتبطة بمشكلة ما. فالفئة الأولى محددة واضحة ال معالم» بينا الثانية ليست 
كذلك. وتتطلب تلبية.الاحتياجات الموضوعية أو الاحتياجات المعلوماتية المرتبطة 
بمشكلة ماءبوجه عام؛ قدرا كبيرا من الجهد. ونادرا ما تطبق المعايير الأخرى (كفورية 
المعلومات على سبيل المثال) لتصنيف الاحتياجات المعلوماتية؛ فالمستفيدون في العلوم 
البحت 5162665 881:0) على سبيل المثال» عادة ما يحتاجون إلى المعلومات الحديثة» 
ينا يمكن للمستفيدين في العلوم المشة 5046 أن يكونوا أكثر اهتماما بالمعلومات 
الراجعة الشاملة. 

وكما سبق أن بيناء فإن أنشطة تنظيم المعلومات واسترجاعهاء ينبغي أن تمليها في 
المقام الأول الاحتياجات المعلوماتية للمستفيدين. ونظرا لأن المستفيد هو من يشعر 
بالحاجة إلى المعلومات» فإن بعد المستفيد» أو ما يتصل بالمستفيد في تنظيم المعلومات 
واسترجاعهاء أمر واضح لا لبس فيه. ولهذا السبب يحاول الباحثون اتباع مج يركز 
على المستفيد» لرسم مسار التطور في استرجاع المعلومات. 


الأنموذج المعرفي والنماذج التي تركز على المستفيد: 

عندما يكون التركيز في تنظيم المعلومات واسترجاعهاء منصبا على المستفيد» 
يستعير الباحئون الذين يطورون الناذج والطرق الجديدة» نظريات ومناهج مستعارة 
من المجالات التخصصية المتصلة بالبشر» كعلم النفس» وعلم الاجتاع. 
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والأنئروبولوجيا أو علم الإنسان. فالأنموذج المعرفي لاسترجاع المعلومات؛ على 
سبيل المثال» إطار يستمد مقوماته بكثافة» من علم النفس المعرفي» بين| يستند تنظيم 
المعلومات واسترجاعهاء في السياقء إلى أسس علم الاجتاع, والأنثروبولوجياء 
والاتصال (2004 ,02808655. وتتناول الأقسام التالية الأنمو ذج المعرفي والناذج 
الأخرى التي تركز على المستفيد في المجال. 
الأنموذج المعرفي: 

الإدراك ههناتمعم» هو الملكة أو العملية الفكرية التي يتم بها الحصول على 
المعرفة 1820781608 أو اكتسابهاء وذلك عن طريق الملاحظة:؛ والتفكير. واللحدس 
(1984 ,.[ة أء امسقطئآن580). ويركز الأنموذج المعرني» الذي يختلف عن الناذج 
الأخرى لاسترجاع المعلومات؛ على الأنشطة المعرفية للمستفيدين» أثناء عملية 
استرجاع المعلومات. كيف تتشكلء على سبيل المثالء الاحتياجات المعلوماتية 
للمستفيد؟ كيف يحكم المستفيد على صلاحية النتائج المسترجعة؟ وهذه الأسئلة صعبة 
ولاشكء. ويعمل الباحثون على الإجابة عنها على مر السنين. 

وتركز نماذج استرجاع المعلومات» التي تناولناها ني الفصول السابقة» على 
المعلومات وجوانب نظام استرجاع المعلومات. فكيف يمكن, على سبيل المثال» 
التعبير عن المعلومات أو الاستفسارات؟ أي أساليب استرجاع المعلوماتء ينبغي أن 
يحظى بالدعم؟ أي أساليب استرجاع المعلومات تعمل أفضل من غيرها؟ إلا أن هذه 
النناذج لا تزال محدودة على نحو ملحوظ؛ إذ إنها لا تولي السياقات الاجتماعية 
والمعرفية التي تتم فيها مهام التنظيم والاسترجاع. الاهتام الكافي ,صعوىءىومل) 
(1996. وبناء على أنموذج إنجورسن (1996) 10861568 المعرني للتفاعل في 
استرجاع المعلومات» هناك ثلاثة عناصر رئيسة (أهداف المعلومات» وتصميم نظام 
استرجاع المعلومات. والبيئة الاجتماعية أو المؤسساتية)» بالإضافة إلى الفضاء المعرفي 
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للمستفيد» الذي يشمل الحالة المعرفية الراهنة» والمشكلة أو الهدف. والشكء والحاجة 
المعلوماتية» والسلوك المعلوماتي. ويتم التركيز في الأنموذج المعرفي على العملية 
المعرفية للمستفيد. 

وللأنموذج المعرفي الكثير من التطبيقات المختلفة؛ فقد صمم بلكن وأودي 
وبروكس (1982) 820015 3880 0003 ,ضأء1اء8: على سبيل المثال» نظاما تفاعليا 
لاسترجاع المعلومات (السؤال والإجابة على سبيل المثال) للكشف عن الاحتياجات 
المعلوماتية للمستفيد. وتحليل بروتوكولات التفكير بصوت مرتفع» أسلوب آخرء 
يطبق في فهم الأنشطة المعرفية للمستفيدين» عندما يكونوت بصدد البحث عن 
المعلومات (ر اجع على سبيل المثال 1982 رناع7655ا8ه1 20025 ر.له أء رسقصده6) . 
وقد تناول بتيجرو وفايدل وبروس (2001) ©8506 820 [ع1]10 ,بعمعنااءط 
الطرق المعرفية للبحث في سلوكيات البحث عن المعلومات؛ بالشرح المفصلء على 
الرغم من أن تعريفهم للأطر المعرفية» يبدو أوسع بكثير من التعريف المتبع في هذا 
الكتاب. وتكمن أكبر مظاهر قوة الأنموذج.المعرفيء في تركيزه على إدراك المستفيده 
ذلك الإدراك الذي يعد عاملا حاسم بالنسبة لعملية استرجاع المعلومات. كيف 
تتشكل الحاجة المعلوماتية؟ كيف تتحول إلى استفسار بحث؟ كيف يتم تقييم التتائج 
المسترجعة؟ وتتعلق كل هذه الأسئلة بإدراك المستفيد» ويهدف الأنموذج المعرفي 
لتقديم إجابات لمثل هذه الأسئلة. 


والأنموذج المعرفي موجه نحو المستفيد الأمر الذي يميزه عن النماذج الأخرى 
لاسترجاع المعلومات» التي تركز على مكوني أو عنصري المعلومات أو النظام, في 
عملية استرجاع المعلومات. فالمستفيدون يتسمون بالديناميكية» وكذلك الحال أيضا 
بالنسبة لاحتياجاتهم المعلوماتية؛ إذ إن لمختلف المستفيدين احتياجات معلوماتية 
مختلفة. ومن شأن الاحتياجات المعلوماتية للمستفيد نفسه. أن تختلف من وقت لآخر» 
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ومن مكان إلى آخر» بل إنها يمكن أن تتغير أثناء التفاعل مع النظام.كما أن الأنموذج 
المعرفي هو وحده القادر على التعامل مع ديناميكيات المستفيدين» فيم| يتعلق بأنشطتهم 
المعرفية في استرجاع المعلومات. وينبغي أن يركز استرجاع المعلومات على المستفيد» 
ومن ثمء فإن التوجه نحو المستفيد في الأنموذج المعرفي» يمكن أن يسهم في بناء نظم 
مرنة» لاسترجاع المعلومات تراعي ظروف المستفيد. 
وعلى الرغم من أن الأنموذج المعرفي يبدو واعدا إلى حد بعيدء بالنسبة للارتقاء 
بمستوى أداء استرجاع المغعلومات. فإن فهم البشر للأنشطة المعرفية» لا يزال محدوداء 
فك نبه إنجورسن (1996) 1562 1121818: 
فإن الحاسبات (أو الكتب بالنسبة لهذا الأمر) تلتزم 
بمسلات ثابتة محددة سلفاء بين| لا يمكن لأولئك البشر أن يتم 
التكهن بهم على المستوى الفردي؛ إذ أنهم يتشكلون ]| هم بناء 
على الخبرات العارضة:» والدلالية» والعاطفية. (6 .0) 
والأنشطة المعرفية للمستفيدين في استرجاع المعلومات» أمر لا يمكن التكهن 
به؛ نظرًا لطبيعة الإدراك؛ ولأننا لى نستوعب بعد العملية المعرفية كاملة. وقد اقترح 
إنجورسن (1996) 1281915612 التنظيم المتعدد 00كأهأمعوءمع-17مم للفضاء 
المعرفي للمستفيد. والفضاء المعلوماتي لنظم استرجاع المعلومات (كتوفير نقاط 
الوصول المتداخلة معرفياء كالكلمات المفتاحية؛ والواصفاتء والاستشهادات 
المرجعية» لأغراض الاسترجاع على سبيل المثال) كطريقة للتغلب على مشكلة الشك» 
وعدم القابلية للتنبؤ فيا يتعلق بالإدراك. وقد تكرر الاقتراح نفسه. من جانب كل من 
إنجورسن ويارفلين (2005) صناء25ل 0ص نعءوتاء 879 12. 
وفضلا عن ذلك. فإن الإدراك ينطوي على بعض القيود الداخلية؛ فطاقة 
الذاكرة البشرية قصيرة المدى» على سبيل المشال» وهي سبع كتل قكلصتاط زائد أو 
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ناقص اثنتين (1956 ,8411161). والكتلة مقياس لأصغر وحدة معلوماتية ذات دلالة. 
فرقم الحاتف في دولة ماء على سبيل المثال» يتكون من ثلاث كتل من المعلومات» هي 
رمز المنطقة 7١7(‏ على سبيل المثال) ورمز الإقليم (77 على سبيل المثال) والأرقام 
الأربعة الأخيرة (148194 على سبيل المثال). والمضمون المباشر لما انتتهى إليه ملر 
11161 بالنسبة للمستفيدين» في عملية استرجاع المعلومات» هو قدرتهم المحدودة 
على تجهيز المعلومات. فإذا كان أحد نظم استرجاع المعلومات يقدم اثني عشر خيارا 
مختلفا في الوقت نفسهء فإنه يمكن للمستفيدين مواجهة مشكلة؛ لأن مقدار المعلومات 
المقدمة يزيد عن طاقة استيعاب ذاكرتهم قصيرة المدى؛ ومن ثم فإن نظم استرجاع 
المعلومات. لا ينبغي أن يكون بهاء على سبيل المثال» قائمة اختيار تشتمل على أكثر من 
تسعة خيارات. ومن ناحية أخرى يمكن للمستفيد أن يشعر أيضا بالإرهاقء أو الملل» 
أو القلق» عندما يقدم له الكثير من الاحتمالات. ويمكن لكل هذه العوامل أن تؤثر في 
الطاقة المعرفية أو الإدراكية للمستفيد. وينبغي أن يضع.الأنموذج المعرفي لاسترجاع 
المعلومات» مثل هذه العوامل في الحسبان. 

والبشر هم أكثر المخلوقات تعقدا في الكون. وأقل جوانب البشر قابلية للفهم 
هو إدراكهم؛ في حين يحاول الأنموذج المعرني التصدي لمشكلة استرجاع المعلومات» 
من المنظور المعرفي. فالنهج مهم» وموجه فعلاً نحو ال هدف مباشرة, إلا أنه يواجه أيضا 
تحديات ضخمة. 


النماذج الأخرى لاسترجاع المعلومات التى تركز على المستفيد: 
ازدهرت بحوث الاحتياجات المعلوماتية والمستفيدين» في السنوات الأخيرة. 
فوفتقا لما انتهى إليه جوليان وداجان (2000) 10118832 220 2ء11اتالء شكلت 
دراسات الاحتياجات المعلوماتية» والتماس المعلومات». والإفادة من المعلومات؛ ما 
يصل إلى حوالي 8 بالمئة» من الإنتاج الفكري البحثي في علم المكتبات والمعلومات» 


354 


وقت إجراء دراستهم|. ومن المحتمل أن تكون هذه النسبة المئوية قد ارتفعت منذ ذلك 
الحين. وكثير من هذه الدراسات مكرس للناذج والمداخل المفاهيمية» التي تركز على 
المستفيد في استرجاع المعلومات (راجع على سبيل المثال اع سأكلاء8 :1989 ,روعادظ 
9 ,ه115 :1993 181 ناكا 2 ,1210 :1995 ..81). ويمكن 
الاطلاع على مراجعات إضافية لجذه الدراسات 5 كيس (2007) 0256)» وانجورسن 
وييرفلين 2005) صناء319[ 2520 1287767562 وسبنك وكول ع001) 3820 عاصامم 
(2006): وولصون (1999) 88/11508, إذ استقصى المؤلفون» وقارنوا واستكشفوا 
نماذج متعددة» تركز على المستفيد» وعلى نحو لا يستهان به من التفصيل. 

ولاتتسم تلك الناذج التي تركز على المستفيد بالوفرة في الكم فحسبء وإنما 
تشكلت أيضا بتوجهات متنوعة أيضاء ومن زوايا نظر مختلفة. وبذلك يحاول الباحثون 
تقسيم مثل هذه الناذج إلى فئات» وفقا لمعايير معينة» من أجل مساعدة الآخرين على 
تحقيق فهم أفضل لما. فقد ذهب ييرفلين وولصون «هوؤلة]آ سه صناء صقل 
(2003)» على سبيل المثال» إلى أن بعض الناذج ذاات طابع موجز (راجع على سبيل 
المثال 1996 ,هعد 0ع س1 :1989 ,181115) بينا النماذج الأخرى أكثر تحليلا (راجع 
على سبيل المثال وضتاء815ل عن صوعاوزوظ8 :1982 ,810015 6ه ,0003 رستعلاء8 
25). . ومن ناحية آخر ى قسم سبنك وكول (2006) 0016 4ه علمام؟ النماذج 
التي تركز على المستفيد» إلى ثلاث فئات؛ هي منظور حل المشكلات (راجع على سبيل 
المثال ,ه5115 :1993 وتتقطالطدديكا :1982 ,وعلهمظ عه 0003 يسمتلاعظ 
9,» والتماس معلومات ال حياة اليومية» وإضفاء المعنى (راجع مكيل لكان 
1 ,تلقتطاهط) ع أتقاود] :1992 رسصالتء172). والتزود بالمعلومات (ر اجع 
على سبيل المثال 1999 ,50هن) عق ا1أونناط :1989 ,5ع886). وبصرف النظر عن 
الطريقة التي يتم بها اختبار النماذج فيم| بعد, فإنها جميعها تتسم بخاصية واحدة 
مشتركة؛ ألا وهي وضع المستفيد في مركز الأنموذج الذي يتم تصميمه. 
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وقد أشار ولصون (2008) 7811508 في وقت لاحقء إلى أن تطور بحوث 
استرجاع المعلومات» التي تركز على المستفيد» قد أفضى إلى التمييز بين احتياجات 
الأوساط الأكاديمية إلى أعمال تستند إلى أساس نظريء واحتياجات ال مارسين إلى 
توجيهات الارتقاء بمستوى الخدمات. كذلك بين ولصون أن الفصل بين البحث 
والمارسة» يتحقق إلى مدى لا يستهان به؛ فقد كانت البحوث المبكرة يجريها ممارسون» 
أما البحوث الراهنة فيتم إجراؤها فى الوقت الذي تسيطر فيه الأوساط الأكاديمية على 
المشهد. إلا أن الفصل بين البحث والمارسة يمكن أن يؤدي إلى لمحاوف في المجال؛ 
نفو أن الأتدوذ ع الذئ يزكر عل المستقيده يك أن ركرن يلا عت مال تكن نه 
مضامين تطبيقية يعتد بها في استرجاع المعلومات» مهما كان من الممكن أن تتوافر له من 
مقومات الروعة. ويميل الفصل بين البحث والتطبيق أو الممارسة» لأن يفضي إلى نتائج 
لا أهمية لهاء في محال استرجاع المعلومات. يضاف إلى ذلك أنه ربها يكون قد آن الأوان 
لتأمل الناذج التي تركز على المستفيد» التي صممت فعلاء والبحث في السبل المحتملة 
لتطبيقهاء لمساعدة المستفيدين على الارتفاع بمستوى أدائهم, في أنشطة التماس 
المعلومات واسترجاعها. وبين| يبذل بعض الباحثين (راجع على سبيل المشال ,»ىه© 
9 ,رده11115 20055 مرستاء قل على «دعوء م1288 :2007) جهودا طيبة في هذا 
الصدد؛ تدعو الحاجة؛ ولاشك إلى المزيد من العمل في هذا المجال سريع التطور. 


تفاعل المستفيد مع النظام: 


واجهة المستفيد ع©17]2ع]21مآ1 عقناء مصطلح تم سكه لوضع ما يتعلق بالمستفيد 
على وجه التحديد, في تنظيم المعلومات واسترجاعها في الحسبان؛ فواجهة التعامل هي 
مايراه المستفيد ويسمعه ويلمسه. في التفاعل مع النظام (1991 ,85ط5). إلا أن 
مصطلح الواجهة يبدو ساكناً 5]812: ولا يركز إلا على نقطة واحدة لتفاعل المستفيد 
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مع النظام. ولهذا السبب نستعمل مصطلح “تفاعل المستفيد مع النظام” -“عكنا 
نع معام معاووى أو "”التفاعل '' 2وفاء6©2هآ ببساطة. في هذا الكتاب». 
للدلالة على الأنشطة الديناميكية التي تدور بين المستفيد ونظام استرجاع المعلومات. 
والمصطلح الآخر الذي ينبغي أن يحظى ببعض التوضيح. في هذا الفصل» هو تفاعل 
الإنسان مع الحاسب 12167201011 “1ع نام نامع تاقتستاطل أو تفاعل الحاسب مع 
الإنسان صمتاءع معام مقصسط عا نمنوم. وم يستعمل أي من المصطلحين 
في هذا الكتاب؛ لأن كلا من ”الحاسب'“ و”الإنسان“ لها معانٍ أوسع مما يتعلق 
بالنظام والمستفيد» في تنظيم المعلومات واسترجاعهاء أي المجال الذي هيدف هذا 
الكتاب إلى تغطيته. 


أساليب تفاعل المستفيد مع النظام: 

يمكن لتفاعل المستفيد مع النظامء في تنظيم المعلومات واسترجاعهاء أن يحدث 
بأي من الأقناليت التالية: لغة إصدار الأوامر 132801286 20ةتصدهمء؛ والاختيار 
من قائمة الخيارات 105]ع5©16 526811 والتشغيل التصويري لهعءتطمةمع 
00 وتعيئة الناذج أو الاستارات 1111885 «تمك. والرو ابط الفائقة 
تكلمتارع موقط وحوار اللغة الطبيغية 012108 1238280286 [22401:3. ومن الممكن 
أيضا تطبيق هذه الأساليبء تزامنياء أي بالتوازي لتنظيم المعلومات واسترجاعهاة 
لغة إصدار الأوامر: 

لقد كانت لغة إصدار الأوامر هي الشكل الأول زمنياء الذي تم وضعه لتفاعل 
المستفيد مع النظام» وكانت لهذا الشكل السيطرة في نظم استرجاع المعلومات. وخاصة 
:نظم الخط المباشرء مثل ديالوج 814100 في العهود المبكرة لتنظيم المعلومات 
واسترجاعها. وفي هذا الأسلوب يضغط المستفيد على مفاتيح لغة إصدار الأوامر (أي 
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اللغة الاصطناعية المصممة خصوصًا لأغراض الاسترجاع)؛ وذلك لإعطاء الأوامر 
للنظام لإنجاز وظائف معينة (كالبدء والبحث على سبيل المثال). ومصطلحات لغة 
إصدار الأوامر موجزة» مثل '“تسجيل الخروج “108015 لإنباء عملية البحث وترك 
نظام الاسترجاع. والميزة الأخرى للغة إصدار الأوامر» هي سرعة التفاعل ,1.8586) 
(1999 ,لإ112)1 عت 1600. وبالمقارنة بأشكال التفاعل الأخرى» فإن لغة إصدار 
الأوامر أسرع بكثير» في الحصول على الاستتجابات من النظام؛ لأنه ليست هناك أي 
خطوات إضافية (كتزجمة قائمة الخيارات إلى أوامر للنظام على سبيل المثال) يتم 
تنفيذها. وبذلك المعنى يكون التفاعل بين المستفيد والنظام مباشرا. كا أن للسرعة * 
قيمتها أيضاء في بيئة تتوقف فيها رسوم الاسترجاع إلى حد بعيد» على وقت الارتباط 
وتكلفة الاتصالات. وفضلا عن ذلك يجد المستفيدون مرونة في اختيار أي الأوامر 
يمكن استخدامهاء ولا يقتصرون على الخيارات التي ترد في قائمة الخيارات على سبيل 
المثال. ونتيجة لذلك يستطيع المستفيدون التحكم في.التفاعل على نحو مباشر. 

غير أن لغة إصدار الأوامرء كأسلوب للتفاعل» لا تبدي تعاطفا مع المستفيده 
وعلى المستفيد أن يتعلم هذه اللغة» وأن يتمرس بهاء ويطبقها على نحو منتظمء نظرا 
لطابعها الاصطناعي. ويمكن لمعنى الأمر ألا يكون ني بعض الأحيان واضحا وصريجحا 
بالنسبة للمستفيد؛ فكلمة ' اختر" 561606, على سبيل المثال» تقوم مقام “ابحث عن” 
0 تعنتهعى في لغة ديالوج. يضاف إلى ذلك أنه قل يكون هناك توحيد 
'تأندمكتصن بين لغات إصدار الأوامر» من حيث النحو أو النظم مامه والدلالة. 
فمن الممكن للغة إصدار الأوامرء بالنسبة لإنهاء جلسة البحثء أن تشتمل على 
أخروج” له في نظام ماء و تسجيل المخروج” 18065 في نظام آخر. ومهما يكن فإن 
التفاعل القائم على لغة إصدار الأوامر قلم| يكفل للمستفيد المساعدة والإرشاد. فيما 
يتعلق ب| يتعين عليه القيام به. ويمكن للنظام على سبيل المثال» أن يستعجل ”أدخل 
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أمرًا #سمقسصوم م معام“ ولا يلمح بشأن أي أمر يمكن إدخاله. ونظرالهذه 
الصعوبات»ء فإن لغة إصدار الأوامر غالبا ما تكون أسلوب التفاعل بين نظام ' 
استرجاع المعلومات والوسطاء (اختصاصيو المكتبات واختصاصيو إجراء عمليات 
البحث على سبيل المثال) لا بين نظام استرجاع المعلومات والمستفيدين النهائيين. 
الاختيار من قائمة الخيارات: 

الاختيار من قائمة الخيارات» أسلوب للتفاعل صمم جزئيا للتغلب على أوجه 
قصور لغة إضدار الأوامز. ولقد كانت نظم الأسطوانات المكتنزة» والفهارس المتاحة 
على الخط المباشرء أول أنواع نظم استرجاع المعلومات التي تستخدم أسلوب التفاعل 
المعتمد على الاختيار من قائمة الخيارات؛ إذ يتفاعل المستفيد مع النظام بالاختيار من 
الخيارات المتاحة» المسجلة في قائمة الخيارات؛ الأمر الذي يفيد من قدرات البشر 
بالنسبة للإدراك» التي تفوق قدرات التذكر. ومن ثم» فإن المستفيد في أسلوب 
الاختيار من قائمة الخيارات؛ لم يعد بحاجة لأن يتذكر الأوامر والعمل بهاء كما في 
أسلوب لغة إصدار الأوامر. كذلك تتسم قوائم الخيارات بالتحديد بالنسبة لعملية 
الاسترجاع. وتختلف خيارات القائمة التي تظهرء على سبيل المثالء أثناء جلسة 
البحثء عنن تلك التي تظهر وقت مشاهدة نتائج عملية البحث. وفي مقابل ذلك على 
المستفيد أن يقرر متى يستعمل أي أمر» في أسلوب لغة إصدار الأوامر. يضاف إلى 
ذلك أن المساعدة تظهر في شسكل قائمة الخيارات في متناول المستفيد» في أسلوب 
التفاعل القائم على قائمة الخيارات. 

وكأسلوب للتفاعل» يبدو الاختيار من قائمة الخيارات» أكشر تعاطفا أو أكثر 
مراعاة لظروف المستفيد» ما هو عليه الخال في لغة إصدار الأوامر. إلا أن الاختيار من 
قائمة الخيارات لا يتمتع بسرعة لغة إصدار الأوامر؛ إذ أنه يتعين على المستفيد أن 
يتفاعل مع النظام عن طريق قائمة الخيارات» وقد يستغرق الاختيار من قائمة 
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الخيارات وقتا أطول من كتابة الأمرء وخصوصا عنلما يتوافر بالنظام عدة مستويات 
لقوائم الخيارات. ومن الممكن أن يقع العبء الزائد على الذاكرة» إذا كان عدد 
خيارات القائمة يزيد عن طاقة الذاكرة قصيرة المدى (أي رقم ملر 1411165 السحري 
سبعة زائد أو ناقص اثنين» الذي تناولناه في )١/7 /٠١‏ كذلك يفتقد المستفيدون 
المرونة في التفاعل مباشرة مع النظام؛ نظرا لأن اختيارهم يقتصر على ما يمكن أن 
يوفره النظام. إلا أنه بالنسبة للمستفيدين المبتدئين يفضل أسلوب الاختيار من قائمة 
الخيارات» عند التفاعل مع نظم استرجاع المعلومات. 


الأسلوب التصويري للتفاعل: 

يتم تطبيق الأسلوب التصويري لتفاعل المستفيد مع النظام؛ بواسطة الأيقونات 
05 أو الرموز التصويرية» والأزرار (بما في ذلك أزرار المذياع) والنوافذ» والخرائط 
التي يمكن النقر عليها. ويتفاعل المستفيد مع النظام بالتعامل (بالإشارة والنقر على 
سبيل المثال) مع مثل هذه التمئيلات البصرية. ويعتمد الأسلوب التصويري للتفاعل 
على الرموز في نظم استرجاع الإنترنت. ويستخدم أسلوب التفاعل هذا تمشيلات 
لموضوعات الكلات الحقيقية (كأيقونة الطابعة للطباعة» وأيقونة الأسطوانة لحفظط 
الملفات» على سبيل المثال)» ووسيمات المفاهيم (كالمفتاح الموسوم للبحث على سبيل 
المثال) بوصفه الواجهة بين المستفيد والنظام. ومن الممكن للنوافذ أن تفتح, ويعدل 
حجمهاء وتغلق» تبعا للحاجة بالنسبة للتفاعل. وتكفل الخرائط القابلة للنقرء 
للمستفيد استرجاع المعلومات» بمجرد النقر على النقطة التي تمثلها. فمن الممكنء على 
سبيل المثالء لنقرة على مدينة نيويورك» على خريطة وطنية للولايات المتحدة 
الأمريكية» أن تفضي إلى عرض خريطة المدينة. ويمكن لخاصتي التكبير والتصغير 
إذ كانتا تحظيان بالدعم» أن تكونا مفيدتين إلى أبتعد حدء في التعامل مع الخرائط 
القابلة للنقر. 
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ويمكن للأسلوب التصويري للتفاعل أن يتخذ أشكالا مختلفة» إلا أن هذا 
الأسلوب بوجه عام؛ يكفل للمستفيدين اليسر عندما يتفاعلون به؛ فتصوير الأنشطة 
التي تنطوي عليها مهام الاسترجاعء يؤدي إلى تجنب زيادة تحميل المستفيد بالأعباء 
المعرفية (كالاختيار من بين قائمة طويلة من الخيارات؛ على سبيل المثال). ويمكن 
للمستفيد أن يجد متعة في أسلوب التفاعل التصويريء؛ الحي والملون في غالب 
الأحيان. وتكفل التعددية الكامنة في هذا الأسلوب» للمستفيد القدرة على إنجاز 
مهمة الاسترجاع على نحو .أكثر كفاءة؛ فمن الممكن. على سبيل المشال للمستفيد أن 
. يختار أيقونات للتعامل مع المهام المحددة واضحة المعالم» في استرجاع المعلومات 
(كالطباعة على سبيل المثال) بين! يختار المفاتيح للأمور المجردة (كالبحث البوليني على 
سبيل المثال). 

إلا أنه لا ينبغي الاستهانة بالصعوبة التي ينطوي عليها تطوير الأسلوب 
التصويري للتفاعل؛ فبعض العمليات في استرجاع المعلومات (كالاتجاه نحوقمة 
الوثيقة» على سبيل المثال) لا يمكن تمثيلها على النحو المناسب بالأيقونات. يضاف إلى 
ذلك أنه من الممكن للتفاعل التصويري أن يكون غير ضروري بالنسبة لأنشطة معينة 
في استرجاع المعلومات (كإدخال الاستفسارات على سبيل المثال). ويمكن لمعنى 
التمثيلات التصويرية» مالم يكن قد تم اختياره على نحو مناسب, أن يكون مضللا أو 
يساء فهمه. وتشغل التصميمات التصويرية للتفاعل المزيد من حيز الشاشة» ومن ثم 
فإنها قد لا تفسح مجالا للمعلومات القيمة (2005 ,أصقدته[2 عت سقصمع0أعصطة). 
كما أن الوقت اللازم للتفاعل في الأسلوب التصويريء أطول بكثير تماهو عليه في 
أسلوب لغة إصدار الأوامر» أو أسلوب الاختيار من قائمة الخيارات» نظرا للمواد 
التصويرية. ومن ثم, فإنه يمكن لاسترجاع المعلومات بهذا الأسلوب أن يكون بطيئا 
وثقيلاء وهو أمر قد لا يثير ممحاوف المستفيد؛ لأن وقت الارتباط لاا يشكل سوى 
القليل في حساب تكلفة الاسترجاع في مثل هذه النظم لاسترجاع المعلومات (كنظم 
استرجاع الإنترنت على سبيل المثال). 
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النماذج الأخرى لتفاعل المستفيد مع النظام: 

الاستمارات أحد أساليب التفاعل بين المستفيد والنظام؛ إذ يقوم المستفيد عند 
اتباع هذا الأسلوب بتسجيل عناصر كمصطلحات البحثء» ويرسم حدود البحث» 
على استمارة يوفرها النظام. وينطوي أسلوب تعبئة الاستمارات فعلا على خواص 
قوائم الخيارات المنسدلة 11-0002نام والأزرار. والفهارس المتاحة على الخط المباشر» 
ونظم استرجاع الإثترنت» نوعان من نظم استرجاع المعلومات التي غالبا ما تدعم 
أسلوب التفاعل هذا. فالمستفيد يقوم بإجراء عملية البحث بالاطلاع وتعبئة , 
الاستمارة. وليست هناك قرارات صعبة يتخذها المستفيد» وإنما يرشد النظام المستفيد 
خلال عملية صياغة الاستفسار وتقديمه. ووجه القصور الواضح في هذا الأسلوب» 
هو افتقاده للمرونة في تفاعل المستفيد مع النظام؛ نظرا لأن المستفيد مقيد بم| 
يرد في الاستمارة. ش 

وتمثل الروابط الفائقة شكلا آخر للتفاعل. وهناك بعض أوجه التشابه بين 
الروابط الفائقة والاختيار من قائمة الخيارات؛ حيث يتفاعل المستفيدون ببذين 
الأسلوبين بالنقر على أحد عناصر قائمة الخيارات» أو إحذى الروابط الفائقة» التي 
تفضي إلى كيان آخر (قائمة خيارات أو إحدى الوثائق الأخرى على سبيل المثال). إلا 
أن الروابط الفائقة لا:يتعين تقديمها في مجموعات» كا في حالة الاختيار من قائمة 
الخيارات. ومن الممكن للروابط الفائقة أن تنشأ حيث] تدعو الحاجة إليهاء منفردة أو 
مع روابط فائقة أخرى. وكا بينا في 5/ 7/ ؟ فإن بنيان الرابطة الفائقة» يشجع على 
التصفح؛ ومن ثم فإن الروابط الفائقة تطبق على نطاق واسع. في نظم استرجاع 
المعلومات» التي تركز على التصفح. وياهو! !8200لآ» نظام استرجاع الونترنت القائم 
على الآدلة» مثال ممتاز لأسلوب التفاعل القائم على الروابط الفائقة. ويقوم المستفيد 
بإنجاز مهام الاسترجاع بالتصفح عبر الفئات المرتبطة ارتباطا فائقاء التي يطورها 
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ياهو!. ويكمن وجه القصور الرئيس للروابط الفائقة كأسلوب للتفاعلء» في بنيانها 
الشبكي. فمن الممكن للمستفيد أن يضل طريقه بسهولة عند التفاعل مع النظام باتباع 
الروابط؛ لأن الروابط الفائقة تتبع البنيان الشبكي» وغالبا ما يشبه البنيان الداخلي 
للروابط الفائقة المتاهة» لا المجموعة محكمة البنيان من الروابط. ومما لاشك فيهء 
أنه كلما زاد عدد الروابط الفائقة في نظام الاسترجاع» أصبح النظام أكثر إرباكا 

وقد بدأت اللغة الطبيعية تستخدم في التفاعل بين المستفيد والنظام؛ ويبدوق. 
تقديم الاستفسارات باللغة الطبيعية لنظام استرجاع المعلوماتء أحد الجهود الضخمة 
في هذا الصدد. فنظام آسك دوت كوم 416.683 (الذي كان يسمى من قبل سل 
جيفز 669©5ل ع491) يكفل للمستفيد إدخال الاستفسارات. باستعمال الجمل الكاملة 
(مثل: ما معالجحة اللغة الطبيعية؟). وأكبر مزايا استعمال اللغة الطبيعية» في التفاعل بين 
المستفيد والنظام» هي طابعها الصريح المباشر؛ إذ يمكن لأي تمثيل للاستفسار أن 
يسفر حتما عن تحريف وتغيير في المعنى؛ ومن ثم فإن المستفيد في أسلوب اللغة الطبيعية 
للتفاعل» قد لا يكون بحاجة لأن يفسر معنى التمثيلات التي تنشأ لأغراض التفاعل 
(مثل لغة إصدار الأوامرء والأيقونات» وعناصر قائمة الخيارات). وبين| تبدو اللغة 
الطبيعية شكلا مرغوبا فيه إلى أقصى حد للتفاعل بين المستفيد والنظامء فإن التطبيق 
الناجح لهاء يتوقف في النهاية على تقدم البحوث حول معالجة اللغة الطبيعية» وهذا 
موضوع نستكشفه في الفصل الثاني عشر. 

ويرتبط ارتباطا وثيقا بأسلوب اللغة الطبيعية للتفاعل» استخدام الصوت في 
نظم استرجاع المعلومات؛ فالمستفيد في هذه الحالة يتفاعل مع النظام عن طريق اللغة 
المنطوقة لا اللغة المكتوبة. ويعتمد هذا الأسلوب للتفاعل بقوة» على تقنيات التعرف 
على الأصوات, التي لا تزال في مرحلة التطور. 
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وقدبدأت واجهةالمستفيد العضوية (010[1) ع7126عاسا «عكنا عتصوع:ه 
تظهر في الإنتاج الفكري (راجع على سبيل المثال ,«اعلإمنا0 عه لمدوعامء7؟ 
8) كشكل محتمل لتفاعل المستفيد مع النظام. وقد اختير اسم هذا الشكل لأن: 
)١(‏ التقنيات الداعمة بالنسبة لبعض أهم تطورات واجهة المستفيد العضوية» هي 
الإلكترونيات العضوية» و(5) أن ملايين الأشكال العضوية التي نلاحظها في 
الطبيعة» مذهلة في تنوعهاء ومرونتهاء وقابليتها للنقل أو التحول» وتكيفها الطبيعي؛ 
واحتمالاتها التطورية» بين| تبدو مرنة ومن الممكن الاعتاد عليها في الوقت نفسه. وقد 
أحصى فر تجال وبوبيريف (2008) 87عالإمنا20 880 [98و776 ثلاثة جوانب» 
تدد مهال واجهة اميد اليغنزية# ارا آن الخلات يناري الخرعيات: ووفتيلة . 
العرض أيضا هي وسيلة المدخلات. وشاشة اللمس بمثابة مثال في هذه الحالة. ويقدم 
ركيموتو (2008) 1152040 المزيد من التوضيح لهذا الجانب لواجهة المستفيد 
العضوية» بأمثلة تفصيلية» مثل هولووو ل 1510105211 وسمارت سكين طل][51131)5. 
وثاني هذه الجوانب أن الوظيفة تساوي الشكل؛ إذ يمكن للعرض أن يتخذ أي شكل. 
وتحل واجهة المستفيد العضوية محل المصفوفة المستطيلة الجامدة بالمزيد من المفاهيم 
المائعة 1110 التي تبدو أسطح رقيقة» مرنة ولمسية ©[861)» مهيأة للشكل والحيز 0©) 
(2008 ,امعلستطووط ©. ويمكن لجهاز قراءة الكتب الإلكترونية الذي يمكن طيه. 
أن يصبح حقيقة واقعة» باستخدام تقنيات عرض واجهة المستفيد العضوية الناشئة. 
أما الجانب الثالث لواجهة المستفيد العضوية» فهو ذلك الشكل متواصل التدفق. 
23107 0110185 (أي تدفق تفاعل المستفيد): وبإمكان العروض تغيير شكلها لإنجاز 
الوظائف اللازمة» أثناء تفاعل المستفيد مع النظام. وما ينطوي عليه هذا الجانب هو ما 
يسمى التصميم الحركيء الذي يتم من خلاله إدخال القابلية للنقل الفيزيائي ف 
الواجهة (2008 ولتطوظ1 ث 9ع" نؤمند20 روعغ889:1). .ولما كانت واجهة المستفيد 
العضوية لا تزال رؤية لم تتحقق بعدء فإنه من السابق لأوانه كثيراء معرفة ما لها وما 
عليها كأسلوب للتفاعل بين المستفيد والنظام. 
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الأسلوب الهحين للتفاعل: 

شهدت السنوات القريبة الماضية ظهور أسلوب هجين للتفاعل» وخصوصا في 
نظم استرجاع الإنترنت. ومن الممكن لأي تجمع من أساليب التفاعل التي سبقت 
معالجتهاء أن يشكل واجهة هجيناء على الرغم من أن لغة إصدار الأوامر قلا تندمج» 
نظرا لما يكتنفها من أوجه القصور؛ فإن نظام إكزاليد 15816840 وهو نظام لاسترجاع 
الإنترنت. مقره فرنساء يدعم الاختيار من قوائم الخيارات» والروابط الفائقة» ولغة 
إصدار الأوامر (بالنسبة للمعاملات البولينية» ومعاملات التقارب وما شابه ذلك) 
فضلا عن الواجهة التصويرية. ويمكن للأسلوب الهجين للتفاعلء أن يقضي على 
أوجه 5 التي تكتنف أسلوبا بعينه» ويرتفع بمستوى كفاءته ومراعاته لظروف 
المستفيد. والواقع أننا قلا نشهد التفاعل أحادي الأسلوب. في نظم استرجاع 
المعلومات التي تطورت حديثا؛ نظرا لأن لكل أسلوب للتفاعل ما يكتنفه من 
أوجه القصور. 
الأبعاد الأخرى لتفاعل المستفيد مع النظام: 

فضلا عن أسلوب التفاعل» هناك جوانب أخرى ينبغي أن يضعها المستفيد في 
الحسبان عند التفاعل مع نظام استرجاع المعلومات. وتشمل هذه الأبعاد خصائص 
العرضء وخيارات المخرجاتء. ومقومات المساعدة. 
خصائص العرض: 

يتفاعل المستفيد مع نظام استرجاع المعلومات عن طريق شكل معين من 
العرض.ء إلا أن الأدوات المادية اللازمة للتفاعل (كلوحة المفاتيح أو الفأرة على سبيل 
المثال) تخرج عن حدود مجال هذا الكتاب. ومن الممكن للتفاعل أن تتحدد معالمه بمثل 
خصائص العرض هذه. كاللون» وأشكال الحروف. والكثافة» وإخراج الشاشة. 
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ويوضح إخراج الشاشة كيف يتم عرض المعلومات اللازمة لأغراض 
التفاعل» على واجهة التعامل (شاشة حاسب عادة)؛ فهل يدعم الإخراج الأطر 
المتراكبة» أو النوافذ المتعددة؟ هل يحتاج المستفيد إلى التوجه إلى أعلى أو إلى أسفل ليرى 
كل المعلومات المقدمة؟ ومن الممكن للاستخدام المكثف لخاصية التراكب 
ةمع أو الأعداد الكثيرة من ار أو النوافذ» في عرض واحد. أن يؤثر في 
قدرة المستفيد على التفاعل مع النظام بكفاءة. وكذلك الحال أيضاء فإن معظم 
المستفيدين (المبتدئين على وجه الخصوص) غير متمرسين في أساليب التنقل أو الشف 
8 . ومن المفضل دائما عرض كل المعلومات على شاشة واحدة, إن أمكن, لا 
على شاشات متعددة. 

ويحكم نوع الخط وأسلوبه وحجمه؛ جودة عرض المعلومات النصية. والحد 
الأدنى للمواصفات بالنسبة لعرض النصوصء هو الوضوح والقابلية للقراءة. ويرى 
جاليتز (1997) ائاة6 أنه لا يمكن استعمال سوى نوعين من الخطوط (مثل الروماني 
الجديد للتايمز سهدصه*1 2/6 5©دمة1؛ أو الساعي 16:ناه0) وشكلين مسن 
الأحرف (مثل المألوف 13نعء" والمائل ©14211)؛ وثلاثة أحجام؛ للعرض الواحد. 
وينبغي تجنب أنواع الخطوط غير الواضحة أو غير المقروءة؛ أو أحجام الخطوط 
متناهية الصغر. ويمكن لنمط الفط إذا ما استعمل على النحو الملائم؛ أن ييسر 
عملية التفاعل. 


با ل و ل ا 
التحديد المستوى المريح للمستفيد. عند التفاعل مع النظام. ويحدد عدد الألوان 
وتجميع أو خليط الألوان ما إذا كان العرض النهائي يبدو مستساغا للمستفيد أم لا. 
وينبغي أيضا اختبار الدرجات المناسبة للتباين واللمعان؛ لأن الإفراط في أي من 
العاملين» يمكن أن يتسبب في عدم راحة أعين المستفيدين. ويدخل لون الخلفية» 
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وصورة الخلفية في هذه الفئة من خصائص العرض. ويتبين من الخبرة أن الأسود على 
الأبيضء تجمع جيد بوجه عام بالنسبة للعرض. وينبغي مراعاة الحيطة والحذر عندما 
تستخدم الصور كخلفيات؛ نظرا لأنه من الممكن للصور أن تلقي بظلالها على 
المعلومات المهمة الأخرى التي ينبغي عرضها. كذلك يمكن لتحميل مثل هذا العرض 
أن يستغرق وقتا طويلا. ولهذه الأسباب» فإن بعض نظم استرجاع الإنترنت» التي 
كانت تستخدم خلفيات من الصور في أيامها المبكرة؛ سرعان ما أقلعت 
عن هذا الأسلوب. 

وكثافة العرض عامل آخرء يمكن أن يكون له تأثيره على سهولة التفاعل بين 
المستفيد والنظام؛ فكم من المعلومات على سبيل المثال» يمكن أن يعرض على شاشة 
واحدة؟ وبين) تبدو المواصفات التفصيلية حول الكثافة غير محتملة؛ نظرا لأن عوامل 
كمجموعات الأحرف ا تأثيرها أيضا على الكثافة» فإنه ينبغي مراعاة الدرجة 
القصوى للكثافة في موقف معين. ولا يمكن بوجه عام لأي من الشاشة المزدحمة أو 
الفراغ الزائد عن الحد, أن يحظى بالترحيب من جانب المستفيد. 

ومن الممكن للمؤثرات الخاصة» كتسليط الضوء و الوميضء والعرضٍ المرئي 
العكسبي 71060 ©0765ف أن تعمل جميعها على تحقيق نتائج معينة في تفاعل المستفيد 
مع النظام» إذا ما استخدمت على نحو سليم. ومن الممكن للاستخدام غير المطرد أو 
الإسراف في استخدام أي مؤثر خاصء أن يؤدي إلى الارتباك وربما الإزعاج بالنسبة 
للمستفيد. ومن بين جميع الأنواع الرئيسة لنظم استرجاع المعلومات» تبدو نظم 
استرجاع الإنترنت الأكثر تعرضا للشاشات المعقدة؛ نظراً للإفراط ني استعمال 


المؤثرات الخاصة؛» والخواص الأخرى للعرض. 
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خيارات المخرجات: 


من الممكن تقديم نتائج الاسترجاع بأشكال مختلفة» بناء على محددات كالصيغ 
والكميات. وصيغ المخرجات في نظم الخط المباشرء هي الأكثر تنوعا؛ إذ يمكن 
للمستفيد أن يختار للمخرجات من بين صيغ محددة المعالم سلفا (كالمعلومات الوراقية 
فقطء أو المعلومات الوراقية بالإضافة إلى الممتخلصات على سبيل المثال) أو يحدد 
حقؤلا بعينها (كالمؤلفء والعنوان على سبيل المثال). وعادة ما تدعم نظم الفهارس 
المتاحة على الخط المباشر ثلاث صيغ للمخرجات؛ الصيغ الموجزة» والطويلة؛ 
وتسجيلات مارك. أما فيا يتعلق بنظم استرجاع الإنترنت» فإن خياراتها لصيغ 
المخرجات محدودة؛ نظرا لطريقة تكشيفها. وعادة ما تتكون نتائج الاسترجاع من 
الإنترنت» من العناوين والاقتباسات (أيْ الأسطر القليلة الأولى في الموقع). والجمل 
غير المكتملة هي القاعدة لا الاستثناء في مثل هذه الاقتباسات. 

وعادة ما تزود نظم استرجاع المعلومات المستفيد بوسائل مختلفة» للحصول 
على النتائج» وهي التحميل 6001051080 أو الطباعمة» أو البريد الإلكتروني؛ أو 
العرض على الشاشة. وتدل كمية المخرجات على عدد النتائج التي يتم تقديمها في كل 
مرة يتقدم فيها المستفيد بطلب. وتكفل نظم الاسترجاع على الخط المباشر للمستفيد 
بوجه عام, تحديد أي عدد من النتائج التي تسترجع للمخرجات. وفي المقابل» تتطلب 
نظم الفهارس المتاحة على الخط المباشرء من المستفيدين» بيان خياراتهم؛ بتمييز أو 
اختيار التسجيلات كل على حدة أولا. ومن المعروف تماما أن نظم استرجاع 
الإنترنت» بإمكانها إنتاج الآلاف. إن لم يكن الملايين من نتائج عملية البحث» بسهولة. 
إلا أن المستفيد لا يمكنه عادة الحصول إلا على عشر نتائج أو عشرينء أو ثلاثين» في 
كل مرة يتقدم فيها بطلب للحصول على مخرجات. وليست هناك طريقة تكفل 
للمستفيد الحصول على جميع المخرجات على نحو فوريء إلا أن القصور الذي يكتنف 
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الحصول على نتائج البحث في الإنترنت» لا يشكل هما يذكر بالنسبة للمستفيد» نظرا 
لأن محرجات نظم استرجاع الإنترنت» عادة ما ترتب طبقياء وفقا لنظام تنازلي تبعا 
للصلاحية أو الارتباط بالموضوعء وقليل من المستفيدين من يرغب فعلا في الاطلاع 
على كل نتائج عملية البحث. 

وخيارات المخرجات ليست بالعامل الحاسم في تفاعل المستفيد مع النظام, إلا 
أنه يمكن للمرونة في تقديم نتائج الاسترجاعء أن تدعم التعاطف مع المستفيد أو 
مراعاة ظروفه. وهناك تزايد في كفالة تصوير نتائج البحث بصرياء من جانب بعض. 
نظم استرجاع المعلومات؛ لمساعدة المستفيد في الحصول على نظرة تصويرية لماتم 
استرجاعه. وتبدو الفهارس المتاحة على الخط المباشر (مثقل: 
018. 115111317 20112.0116) و نقلم استرجاع الونترنت(مثل: 
]11.0101 7)) بوجه عام سائرة بخطى أسرع من نظم |الخط المباشرء في 
عرض نتائج البحث بصرياً. كذلك يوفر عدد من نظم استرجاع المعلومات صورا 
مصغرة لأغلفة الكتب (مثل : 012».ع1ع50015.800) أو صفحات العنكبوتية (مثل: 
03 ع[5ة. 00118159 إلى جانب نتائج البحث النصية» حتى يكون لدى المستفيد المزيد 
من المعلومات للحكم على صلاحية النتائج المسترجعة. 
مقومات المساعدة: 

تؤثر مقومات المساعدة (التوجيهية؛ أو التعليمية» أو البطاقات الإرشادية» على 
سبيل المثال) إلى حد بعيد في مدى تعاطف نظم استرجاع المعلومات مع المستفيد؛ أو 
مراعاة ظروفه. وينبغى لمقومات المساعدة أن تساعد المستفيدين فعلا» في العثور على 


إجابات لما يمكن أن يكون لديهم من أسئلة؛ أثناء التفاعل مع نظم استرجاع 
المعلومات. وقد حدد ترنر (1989) 1568361 معالم ستة من مثل هذه الأسئلة» وذلك 
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في دراسة تقارن مقومات المساعدة على الخط المباشر» في ستة عشر نظاما لاسترجاع 
المعلومات: 

.١‏ فيم أخطأت أناء أو لما تلقيت رسالة الخطأ هذه؟ 

؟. هل أفعل أنا الشيء الصحيح؟ 

“.2 أين أنا وماذا يمكن أن أفعل بعد ذلك؟ 

٠.5‏ كيف أفعل شيئا ما؟ 

5. كيف أحصل على بعض المعلومات. 

5 الاذا فشل النظام؟ 

ويتعلق السؤال الأول بالموقف الذي يرتكبٌ فيه المستفيد خطأ ماء أو يتلقى 
رسالة خطأ. ومن المفترض مثالياء ألا تشير مقومات المساعدة إلى الخطأ الذي حدث 
فحسبء وإن| تحدد أيضا ما يمكن عمله لتصحيح الخطأ. إلا أن معظم مقومات 
المساعدة بنظم استرجاع المعلومات. قادرة على تنفيذ الأولى» ولكنها تعجز عن تنفيذ ٠‏ 
الأخيرة. ونتيجة لذلك تترك المستفيد يتخبط بلا هدي في حيرة مرتبكا. وفيهم| يتعلق 
ببقية الأسئلة التتى سجلها ترنر (1989) 3 فإنه يمكن لمعظم مقومات 


المساعدة الإجابة عن السؤالين الرابع والخامس على نحو مناسب بشكل معقولء. إلا 
أنها تبدو ضعيفة في التعامل مع الأسئلة الثاني» والثالث ؤوالسادس. وتبدو مقومات 


المساعدة؛ في الوقت الراهن» قادرة بوجه عام على تسجيل المعلومات الإجرائية 
الخاصة بأنشطة الاسترجاع. وعندما يتعلق الأمر بالأسئلة التي تتطلب توضيحاء فإن 
معظم مقومات المساعدة, في نظم استرجاع المعلومات تبدي عجزها. 

وقد اقترح الباحثون (راجع على سبيل المخال باسمكتداط 2ت مممصدعلتعصطك 
9 ,لتاءعصمءع"1 :2005) إرشادات لتصميم مقومات المساعدة ف النظم 
الإلكترونية» با في ذلك نظم استرجاع المعلومات. ومن وجهة نظر المستفيد. فإن 
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مقومات المساعدة المناسبة ينبغي أن تكون قادرة على توفير الإجابات لأسئلة 
المستفيدين» وليس مجرد تقديم بعض البيانات التي يتم تزويد النظام بها سلفا. وينبغي 
أن تكون الإجابات أيضا خالية من المصطلحات المتخصصة. واللغة التي تنم عن 
التحدي أو التهديد (مثل '“لقد تم تنفيذ عملية غير قانونية“) وأن تكون هذه المقومات 
متاحة طوال الوقتء وللمستفيدين على اختلاف مستوياتهم؛ فالمستفيدون يلتمسون 
المساعدة من نظم استرجاع المعلومات عندما يحتاجون إليهاء وإذا عجزت مقومات 
المساعدة عن تلبية احتياجات المستفيدين» فإن وظيفة نظم استرجاع المعلومات ذاتها 
قد لا تتحقق» وناهيك عن قضية التعاطف مع المستفيد أو مراعاة ظروفه. ١‏ 
تقييم تفاعل ا لمستفيد مع النظام: 

التعاطف مع المستفيد أو مراعاة ظروفه؛ معيار عريض لتقييم تفاعل المستفيد 
مع النظام. وقد تطورت مقاييس أكثر تحديدا (راجع على سبيل المثال 
5 ,21 دذ ته[ عى مسسمدصععل تع صط5) للهدف نفسه. 
الوقت اللازم لتعلم المستفيد مهام استرجاع محددة: 

يحدث التعلم حين) يتفاعل المستفيد مع نظام ما لاسترجاع المعلومات؛ أي أن 
المستفيدين بحاجة لأن يتعلموا كيف يتعاملون مع نظام ما لاسترجاع المعلومات» قبل 
إجراء عمليات البحث فعلا. وتنعكس سهولة التعلم على الوقت اللازم لاكتساب 
التعلم قصيراًء كان نظام استرجاع المعلومات أفضلء فيا يتعلق بتعاطفه مع المستفيد. 
ولا يوفر النظام غير الودي بيئة مريحة يمكن فيها للمستفيد أن يتعلم. 
ببرعة التدامل* 

كم يستغرق تلقي المستفيد للتلقيم المرتد من نظام استرجاع المعلومات»ء أثناء 
التفاعل؟ وكلما طال ما تستغرقه العملية من وقتء يصبح النظام أقل تعاطفا مع 
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المستفيد. وكا ذهبت شنتيدرمان وبليزانت )2قؤلة1[ لصة سفصنء10عصطك 
(2005): فإن زمن الاستجابة بالنسبة للمهام المألوفة» ينبغي أن يكون ما بين ثانيتين 
وأربع ثوانٍء ويمكن لوقت انتظار أطول من خمس عشرة ثانية أن يكون غير إيجابي 
بالمرة. وعلى الرغم من أن مؤشرات أزمنة الاستجابة هذه تتعلق بالتفاعل بوجه عام 
فإنها يمكن أن تنطبق ولاشك على بيئة استرجاع المعلومات. ويتقرر هذا المعيار» في 
الأساسء تبعأ للقدرة التجهيزية لنظام استرجاع المعلومات. وعادة ما تكفل وحدات 
التجهيز القوية سرعة ثفاعل عالية. 
معدل أخطاء المستفيد: 

إذا كان نظام استرجاع المعلومات حدسياء ويفسر نفسه ذاتياء فإن المستفيدين 
يرتكبون قليلاً من الأخطاء في التفاعل معه. ومالم يكن الأمر كذلك فإن الأخطاء لا 
مفر منها (كاللجوء إلى خيار خاطئ على سبيل المثال). وبذلك يصبح عدد الأخطاء 
التي يقع فيها المستفيد» أثناء عملية الاسترجاعء مقياسا آخر للحكم على مدى تعاطف 
نظام استرجاع المعلومات مع المستفيد. ويمكن لمقومات المساعدة التي سبق أن 
ناقشناهاء أن تنهض بدور مهم, في الحد من معدل الأخطاء. ومن الطبيعي أن يقع 
المستفيدون في أخطاء أقل» إذا ما توافرت المساعدة لهم عندما تدعو الحاجة إليهاء إذا 
ما كانت عملية التفاعل شفافة بالنسبة لهم. 
القدرة على التذكر بمرور الوقت: 

تستلزم إجراءات التفاعل» وخصوصا في أسلوب لغة إصدار الأوامر أن يتم 
تعلمها والتمرس ببهاء لكي يتحقق التمكن منها. ويعد الاحتفاظ ببذه المهارات لفترة 
زمنية» تقيبياً لمدى تعاطف نظم استرجاع المعلومات مع المستفيدين» من زاوية أخرى 
مختلفة؛ فمن الممكن على سبيل المثال» للغة إصدار الأوامر أن تكون من السهل 
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تذكرهاء إذا كانت الأوامر قابلة للتذكر وتتسم بالاطرادء كأن يستعمل أمر الطبع كلمة 
أصتدم بدلا من م, أو هلإ» أو أي شىء آخر. ومن شأن واجهة التعامل المتعاطفة» 
نظرا للتعزيز الإيجابي» أن تمكن المستفيدين من الاحتفاظ بما يعرفونه حول النظامء 
لوقت أطول مما تكفله الواجهة غير المتعاطفة. 


رضاء المستفيد: 


وهذا المقياس لمدى تعاطف النظام ذاتي أو غير موضوعي؛ نظرا لأنه من 
الصعب تقييم الرضاء بطريقة موضوعية؛ حتى وإن كان من الممكن التعبير عن 
الرضاء كميا ببعض الطرق (مثل عدد النتائج المسترجعة)» إلا أن هذا المعيار ينبغي 
وضعه في الحسبان في تقييم الجانب النوعي في تفاعل المستفيد مع النظام؛ فكيف يمكن 
على سبيل المثال» أن يشعر المستفيد تجاه التفاعل؟ ويصنف بعض الباحثين (راجع 
1 ,طاء111146 على سبيل المثال) رضاء المستفيد, إلى الرضاء المادي (أي النتائج 
التي يتم الحصول عليها من التفاعل مع نظام استرجاع المعلومات»» أو الرضاء 
العاطفي (أي الإحساس بالإنجاز الناتج عن التفاعل). وكل) كان التفاعل بوجه عام 
أكثر تعاطفاء أصبح المستفيد أكثر رضاءً. 

إلا أن هناك مواءمات لا مفر منهاء بين المعايير الخمسة التي تناولناها توا 
(2005 كصهوتة21:ة سقصع 0 تعصط58). ونادرا ما يبلغ أي تفاعل بين المستفيد 
والنظام قمة الأداء» في كل الجوانب. وينبغي دائها أن يوضع المستفيد في الحسبان؛ نظرا 
لأن جميع أنشطة استرجاع المعلومات تدور في فلك المستفيد» لا في فلك النظام. 

وعلى الرغم من أنه لا يزال هناك الكثير ما ينبغي توافره في تفاعل المستفيد مع 
النظام» فإن الموقف قد تحسن ولاشكء إذ تم اكتساب المزيد من الخبرات في تلبية 
متطلبات المستفيد (1999 ..1 )© ©1358)؛ فمن أسلوب لغة إصدار الأوامرء إلى 
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الأسلوب الحجين للتفاعل» ومن العرض أحادي اللون إلى التطبيق الفني لمختلف 
الخصائص» ومن رسائل المساعدة المحملة بالمصطلحات التقنية. إلى البطاقات 
الإرشادية الخالية من المصطلحات التخصصية» أصبح تفاعل المستفيد مع النظام أكثر 
تعاطفا مع المستفيد اليوم» عم| كان عليه في الماضي . 


المستفيد واسترجاع المعلومات في العصر الرقمي: 

تؤدي التقنيات الرقمية ولاشك. إلى الارتفاع بمستوى كفاءة أنشطة استرجاع * 
المعلومات. كذلك تثير هذه التقنيات بعض المخاوف والقضايا للمستفيد» وخصوصا 
المبتدئ» فاسترجاع المعلومات يعتمد على سبيل المثال؛ في العصر الرقمي؛ على 
التقنيات الرقمية؛ التي يمكن أن تسبب القلق والاغتراب للمستفيد؛ فقد لا يشعر كل 
مستفيد بالراحة عند إجراء عمليات البحث في نظام إلكتروني. ونظرا لما يكتنف النظم 
الراهنة لاسترجاع المعلومات من قصوره فإن المستفيد قد يشعر بالقلق أو عدم 
الاطمئنان عندما يحاول استرجاع المعلومات في البيئة الرقمية. يضاف إلى ذلك» 
الحاجة إلى تجهيزات متخصصة:» لاسترجاع المعلومات رقميا. ولم يعد ههج القلم 
الرصاص والورقء في البحث عن المعلومات يدوياء في البيئة الورقية» يعمل بكفاءة في 
العصر الرقمي. 

وفضلا عن ذلك» فإن نظم استرجاع المعلومات. في العصر الرقمي» يتم 
تطويرها باستمرار» أو يتم إدخال نظم جديدة. وقد يكون على المستفيد أن يتعلم أو 
يُدرَّبٍ على أساس منتظمء لمتابعة التغيرات» التي تضيف أعباء جديدة لخطط عمل 
المستفيد المثقلة فعلا. وبعبارة أخرى» فإن استر جاع المعلومات في العصر الرقمي 
يمكن أن تكون له آثار جانبية بالنسبة للمستفيد؛ نظرا لعامل التقنيات. 
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وبالإضافة إلى عامل التقنيات» يتعين معاملة المستفيدين من نظم المعلومات 
المختلفة» على نحو مختلف؛ نظرا لأنهم عادة ما تكون لديهم خيرات استرجاع 
معلومات مختلفة؛ فالمستفيدون من نظم الخط المباشرء على سبيل المثال» إما أن يكونوا 
اختصاصيو معلومات» يقومون بدور الوسيط» أو مستفيدون نهائيون تلقوا تدريبا 
مناسبا. وفي مقابل ذلكء فإن المستفيدين من نظم استرجاع الإنترنت» قلا يكون قد 
توافر لهم التدريب في استرجاع المعلومات. ومن ثم فإن بعد المستفيد أو ما يتعلق 
بالمستفيد يصبح متزايد الثنوع بالنسبة لاسترجاع المعلومات ني العصر الرقمي. 

وعلى الرغم من أن تنظيم المعلومات في العصر الرقمي» قد لا يكون لهما 
لاسترجاع المعلومات من تأثير عن المستفيدء فإن تأثير التقنيات الرقمية في هذا المجال» 
لا يمكن تجاهله بحال. وما يجعل التأثير أقل وضوحاء هو أن من يقومون بتنظيم 
المعلومات. عادة ما يكونون اختصاصيي معلومات. تكيفوا مع إيقاع العصر الرقمي» 
وسرعته عن طريق تدريبهم وتمرسهم. 
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04 52000 1 0/1 نلا ]0ك 10 471721121 .111127731 1201011031101 
.155-05 ,26 ,لاع 12/171010 


6 10251972118 .(2005) .عستتعطاةن) ,أمدكتة[ظ 320 ,مع ,مممحاع لاع قاد 
 1111711411-0111214167‏ 11176ع 9/7/2 07 - 5170128165 :13711677066 اعكلا 
لاع لودع 001502-1/7 فا :ممأوكه8 .0ع طتك .رشاع ه1116 
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دعم [[ ى'«عاوطء/17 .(1984) .(.805) .1ه أء ,.8 عمسم ,لاممقطل1 50 
.0') عسمتطوت[طناط عل1واعكت] تمماكم8 01110 بر11ىرء م1 اهلا 


2 112323 .(2006) .5ع 1عقط) ,0016 320 ,422202 بعلئامهم 

.05 12150113]108 3220 5ع5ع103م32 0196256 8 للتلأوتوعاما :51 1تتقطء6 

ههه ععتنء ع5 11011 مم17 امك باءقء50 انوع 1« عتتةق 116  0/‏ أهتتلامل 
25-7 .(57)1 ,نإع1[7:010 


عصتلده 2ه ددعم 1 للمع23 عط كه نوع ناد ع/انأمتةمطرم0ء ىر .(1989) .هآ تعممع ا" 
701 5556125 116931ا176 101011031102 عاالأع هعاط مذ "ماعط" 
.119-66 ,(25)2 424716867116721[ عل و171ى5ء 210 


5١‏ 11561 عأصوع 02 .(2008) .13 ,/ل3016م20101 3220 ,[ع0] ,لمدععرء17 
.26-0 ,(51)6 ,1/1 4م 11 0 10115 1ه ترا ستوردم) 

56121910111 110121211011 01 15[ع5400 .(1999) .0آ دنه 1 ,مه17115ا 
.249-270 ,(55)3 ,001/71:2711211011] 07 أهتجتلته ل 

30 غ16562م ,2351 :11561 12101526101 ع12' .(2008) .(آ حتده1" ,ننه117115 
.457-464 ,(34)4 ,ع16رءأ 3 102 1ش تتم ره[ 07 0171ل .1116 1تا1 


عطا 01 امعمرووعودة .(2001) .كلعة/ة ,الأعمعتطن) 220 ,تع 2132 ,2213208 

08 2200615 1262181 مه 5105 11عاعةتقطء 1561 01 كاعه له 

1 :0 بجطء1ء 50 انمع 1711م 1116 كزن 011177101ل .531516125 61781 1ناع1 
.445-459 ,(52)6 ,نزو مامتاءء 1 2710 50167126 
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: الفصل الحادي عشر 
تقييم تنظيم المعلومات واسترجاعها 


الآن» وقد ناقشنا مختلف جوانب ومكونات تنظيم المعلومات واسترجاعهاء 
حان الوقت لتقييم هذه الأنشطة المترابطة. وقد فصّل كثير من الباحثين (راجع؛ 
1.77.58 دوكصة؟ 5 :1999 ووعلإسق8 عه 00ع1' ,عع :هآ :1971 ردعء 1 
على سبيل المثال) القول في الحاجة إلى تقييم تنظيم المعلومات واسترجاعها. ونأمل في 
الارتقاء بمستوى الأداء في هذه الأنشطة؛ عندما يتم التحقق من مظاهر ضعف نظم 
استرجاع المعلومات» ثم التخلص من هذه المظاهر في النهاية» نتيجة لعملية التقيبم. 

وتقيبم تنظيم المعلومات واسترجاعهاء موضوع يحظى باهتمام كثير جدا من 
الباحثين في المجال» وذلك على مدى أكثر من خمسين عاماء إلا أن هناك كثيرا من 
الجدل حول مقاييس التقييم وطرقه. وسوف نناقش في هذا الفصل ثلاثة موضوعات 
رئيسة: )١(‏ مقايبس التقييم (كالتحقيق 58أواعع"م والاستدعاء للهع© على سبيل 
المثال) لأداء تنظيم المعلومات واسترجاعهاء (؟) معايير التقييم بالنسبة لمختلف أنواع 
نظم استرجاع المعلومات. بها في ذلك نبذة عن القابلية للإفادة» (؟) مشروعان كبيران 
لتقيبم تنظيم المعلومات واسترجاعهاء هما اختبارات أو تجارب كرانفيلد 14 تقصهم). 
وسلسلة مؤتمرات استرجاع النصوص (تركع )156‏ لواعاكط18 ع1 
©6165 ونتناول قضية طرق التقييمء بالإضافة إلى التجارب الكبرى 
في المجال. 
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مقاييس تقييم تنظيم المعلومات واسترجاعها: 

تطورت مقاييس كثيرة لتقييم تنظيم المعلومات واسترجاعها. ومن أجل 
الوضوح نناقش مقاييس تقييم تنظيم المعلومات» بمعزل عن مقاييس تقييم 
استرجاع المعلومات. 


كما بينا في الفصلين الثاني والثالث» يمكن للمعلومات أن تنظم بطرق متنوعية. 
والتكشيف. والتقسيم إلى فئات» أي التصنيفء والتلخيصء بعض الأشكال الرئيسة ' 
لتنظيم المعلومات. وعلى الرغم من أن لكل شكل من أشكال تنظيم المعلومات 
خصائصه التي تميزه» فإنه قد قصد بكل هذه الأشكال مجتمعة؛ إبراز جوهر 
المعلومات» وجعل المعلومات قابلة للاسترجاع في| بعد ومن ثم فإن مجموعة مشتركة 
من معايير التقييم (كالدقة. والإيجاز. والاطراد والموضوعية)» يمكن أن تطبق على 
كل أنواع طرق تنظيم المعلومات. 
الدقة: 

الدقة '[13نا20 هي أهم مقياس في تقييم جودة تنظيم المعلومات؛ نظرا لأن 
التنظيم المشوه للوثائق الأصلية» يمكن أن يضيع المغزى الكامل لتنظيمها. وتعني 
الدقة أن يمثل التنظيم محتوى الوثائق الأصلية بدقة. ويمكن للاختزال في التنظيم أن 
يحدث فيا يتعلق بالحجم» وليس فيم| يتعلق بالمحتوى أو المضمون. وينبغي وضع الدقة 
في الحسبان أيضاء في الاستشهاد المرجعى 1108هاك والحجاء على سبيل المثال. 

والتحديد أو التخصيص 7 الاععمهة مقهوم وثيق الصلة بالدقة» وعادة ما 
يستخدم لقياس جودة التكشيف. ويعني التحديد؛ بحكم التعريف. المدى الذي يتم 
به التحقق من مفهوم ما أو موضوع ما في وثيقة ماء بمصطلح دقيق في سلم أو هرم 
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علاقات الجنس والنوع الخاصة به (1995 ,ظ56ذ18»[1). ففي هر م”استر جاع 
المعلومات استرجاع الوسائط المتعددة “استرجاع الفيديو” ون اقسعمقمة 
لوععتاءم مع10؟ لووعتاعءم مالعصة لس هاعم يتم تعيين المصطلح 
"استرجاع الفيديو" للوثيقة التي تتناول الموضوع» لضمان أعلى درجات التخصيص في 
التكشيف. أما المصطلحان الآخران في الهرم» فأدنى درجة في التخصيص. ويتحدد 
التخصيص بلغة التكشيف <أي اللغة المقيدة أو اللغة الطبيعية) المستخدمة. 
وتكفل اللغة الطبيعية للمزء بوجه عام القدرة على تحقيق درجة عالية من التخصيص 
الإيجاز: 

من بين أهداف تنظيم المعلومات؛ مساعدة المستفيدين على الاقتصاد في الوقت 
والجهد. في الحصول على ما يحتاجون إليه من معلومات. وتفجر المعلومات إحدى 
العبارات التي تم سكها لوصف الكميات الهائلة من المعلومات» التي يتعين على 
المستفيدين التعامل معها. ومن ناحية أخرى. فإنه من الحقائق التي لا يمكن إنكارهاء 
أن الأمر يتطلب من المستفيد, لمراجعة ناتج تنظيم المعلومات (كالمستخلصات» 
والملخصات» ومصطلحات التكشيف على سبيل المثال) وقتا أقصر بكثير مما يتطلبه 
الاطلاع على وثيقة أصلية؛ ومن ثم فإن الإيجاز يصبح مقياسا رئيساء للحكم على ما 
إذا كان هدف الاقتصاد في الوقت والجهد قد تحقق فعلا أم لا. 

وقد تم إقرار معايير معينة لمختلف أشكال تنظيم المعلومات (راجع؛ 
8 ,2256قر,كا على سبيل المشال) فيم| يتعلق بالإيجاز؛ فبالنسبة لمقالاات 
الدوريات؛ على سبيل المثال» عادة ما يتم تعيين ما بين حمسة مصطلحات تكشيف 
وعشرة» وإعداد مستخلص من 55١‏ كلمة أو أقل. وإذا ما كان ناتج التنظيم يتخذ 
شكلاً مطولاً» فإنه قلم) يكفل مساعدة المستفيدين على التذكر من أجل الحد من وقتهم 
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المستنفد في استرجاع المعلومات. ومن الممكن معاملة الشمول (1031اكناهط» في 
التكشيف بوصفه مصطلحا يتصل بالإيجاز. وقد عرفت ولّضٍ (1995) طعكتلاء/17 
الشمول بوصفه المدى الذي يتم به جعل المفاهيم والموضوعات قابلة للاسترجاع؛ 
بواسطة مصطلحات التكشيف. ويتحدد الشمول بناء على سياسة التكشيف 
المتبعة في النظام. 


الاطراد: 

من الممكن معالجحة الوثيقة الواحدة بعدة أشكال (كالتكشيف والاستخلاص 
على سبيل المثال) ومن جانب عدة أشخاص. كما أنه من المألوف أيضا أن نرى مطبوعا 
ما (دورية على:سبيل المثال) مكشفا من جانب خدمات تكشيف مختلفة؛ فمجلة 
لسه ععسعء5 «متأمسس مكمسا 1 5017 «معترعدهم4 عطا آأه لممعسول 
1201087 عل مسبيل المثالء تكسف في كاعقعاوط 4‏ لمعتصسعط0) و 
120 ع01 هآ “161نم 2010)». وعشرة مراصد أخر ى لخدمات الاستخللاص 
والتكشيف. وعندما يطبق هذا الأسلوب للمعالجحة المتعددة للمعلومات؛ الذي اقترحه 
إنجورسن (1996) «128956556, فإن الناتج النهائي يمكن أن يكون غير مطرد في 
التغطية والأسلوب. وقد تبين من دراسات التكشيف. أن المستوى المرتفع للاطراد 
'[56 1و أكهه» من الصعب بلوغه؛ وأن اطراد التكشيف يتراوح بين ٠١‏ بالمئة و٠8‏ 
بالمئة (ر اجع على سبيل المثال 1965 ,1100263). وقد سجل كلفردون 001465468 
(1984) أنه عندما كشف مكشفان متمرسان الوثيقة نفسهاء باستخدام اللغة المقيدة 
نفسهاء كانت نسبة المصطلحات المشتركة فيه| بينه| "٠‏ بالمئة فقط. ومن الممكن لتنظيم 
المعلومات. في العصر الرقمي» بفضل الأساليب الآلية» أن يحقق نظريا اطرادا أفضل» 
إلا أن البحوث التجريبية في هذا المجالء لم يتم إجراؤها بعد. 
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ولا يعني الاطراد ضمنا مجرد مضاهاة كلمة بكلمة» وإنما يدل على المعالجة 
الموحدة (كاللغة وعمق التغطية على سبيل المثال) لجوهر الوثائق الأصلية» بصرف 
النظر عن شكل التنظيم» والشخص الذي يقوم بالتنظيم. ويمكن للاطراد أن يؤثر في 
جودة التنظيم؛ وأداء الاسترجاع في النهاية أيضا. 


الموضوعية: 

تشكل الموضوعية 066419343 معيارا آخر للتقييم بالنسبة لتنظيم المعلومات؛ 
نظرا لأن الذاتية 41334 »زطناو» والتفسيرات الشخصية؛ يمكن أن تظهئر في أثناء 
عملية التنظيم. وينبغي لتنظيم المعلومات أن يكون توصيفا موثوقا به للوثيقة 
الأصلية» بدون أي تغيير ني محتواها. ومن المهم أيضا ألا يتم إسباغ أو إضفاء 
الأفضليات الشخصية للمرء على التنظيم. وبمزيد من التحديد, فإن أي تعزيز لأفكار 
المؤلفء أو الإقحام المتعمد لاتجاهات المكشفء أو اختيار مصطلحات تعبر ضمنا عن 
الاتجاهات, أو تجاهل أو إهمال أفكار وردت بالوثيقة» ف الكشاف. ينال فعلاً من 
موضوعية تنظيم المعلومات (1991 ,[861). فالتنظيم المتسم بالذاتية لا يعبر عن 
الصورة الحقيقية للوثائق الأصلية. 
الوضوح., والقابلية للقراءة, والقابلية للإفادة: 

بالإضافة إلى المقاييس التي تناولناها تواء طرحت معايير أخرى لتقييم تنظيم 
المعلومات. والوضوح 531495هك» والقابلية للقراءة أو الانقرائية واتازطة20ع. 
والقابلية للإفادة أو الاستخدام 1145ؤطهدلة, من بين هذه المعايير. وتحاول كل هذه 
المقاييس إبداء التعاطف مع المستفيد أو تيسير مهمته ووعص 816501 «عقناء وجعل 
المستفيدين يشعرون بالراحة أكثر عندما يتعاملون مع ناتج تنظيم المعلومات. 
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ومقاييس التقييم بالنسبة لتنظيم المعلوماتء أقل من تلك الخاصة باسترجاع 
المعلومات» ى] أن هذا الضرب من التقييم لا يميز أيضا عمليئنة التنظيم عن أداء 
التنظيم. وإذا أردنا الدقة» فإن جودة التنظيم لا يمكن أن تقيم فعلاء مالم يستعمل 
ناتج التنظيم في استرجاع المعلومات. وفي الوقت نفسه. تتوقف جودة استرجاع 
المعلومات على جودة تنظيم المعلومات. فالتنظيم الجيد للمعلومات» ينهض بدور لا 
غنى عنه في ضمان أداء الاسترجاع الجيد؛ ولا يمكن إلا من خلال استرجاع المعلومات 
الحكم في النهاية على جودة تنظيم المعلومات. 


مقايبس تقييم استرجاع المعلومات: 

بالمقارنة بتنظيم المعلومات» حظى استرجاع المعلومات بقدر كبير جدامن 
الاهتمام» من جانب الباحثين فيها يتعلق بمقاييس التقييم» ويرجع ذلك جزئيا إلى أن 
الأول محرد شرط أساس للأخير. وكما سبق أن ذكرناء فإن جودة التنظيم لا يمكن 
تقييمها فعلا إلا عندما يستعمل ناتج التنظيم في الاسترجاع. واسترجاع المعلومات 
نشاط يركز على الأداء» ى) يركز على العملية في الوقت نفسه. على الرغم من أن البشرء 
وخصوصا المستفيدين النهائيين» عادة ما يبدون اهتماما بي يتم استرجاعه: أكثر مما 
مبتمون با يتم فعلا أثناء عملية الاسترجاع. إلا أنه يمكن للفهم الأفضل لعملية 
الاسترجاعء أن يؤدي إلى الارتفاع بمستوى أداء الاسترجاع. ولهذا السبب» فإن 
مقاييس التقييم التي تطورت لاسترجاع المعلومات» يمكن تقسيمها تقريبا إلى نوعين؛ 
أولهما يركز على الأداءء ويركز الآخر على العملية. ونناقش النوع الأول من المقاييس في 
"0١‏ بين| تحظى مقاييس تقييم عملية الاسترجاعء أو نظام استرجاع المعلومات 
برمتهء بالاهتمام في /١١‏ 7. ومن بين مقاييس تقييم أداء الاسترجاع» يعد الاستدعاء 
والتحقيق أشهر معيارين» وهما الأوسع مدى في الاستخدام (1992 ,59110). 
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الاستدعاء والتحقيق: 

يقدم الجدول رقم ١/1١‏ جميع الننائج المحتملة بالنسبة للهمة الاسترجاع 
باستعمال الرموز والمصطلحات التي عادة ما نجدها في الوثائق التي تتناول استرجاع 
المعلومات. فالتسديدات عافط على سبيل المثال» تعني الوثائق المسترجعة الصالحة أو 
المرتبطة بالموضوع 761678824. وتعرف الاخفاقات”“ مع كلم بأنها الوثائق الصالحة 
التي لم تسترجع. وبناء على نتائج الاسترجاع المحتملة هذه. أمكن اشتقاق مقاييس 
تقييم متنوعة. والاستدعاء والتحقيق» اللذان اقترحها في البداية كنت وزملاؤه 04ءك1 
(1955) وعناعدءلامء ولط لطة كمعامل الصلاحية ماع19 لإعمعم ةرعم ومعامل 
الاستدعاء 1240 1[1هع56, اثنان من مثل هذه المقاييس. 


الجدول رقم ١/١١‏ نتائج الاسترجاع المحتملة 





أ+ب +ج+د 


(كل ما ف النظام) 
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وكا تبين لنا في 0/ ”/ ؟» فإن الاستدعاء (10 في المعادلات التالية) يعرف 
بوصفه نسبة عدد الوثائق المتصلة بالموضوع .المسترجعة؛ إلى إجمالى عدد الوثائق المتصلة 
بالموضوع في النظام. وباستعمال الرموز الواردة في الجدول رقم »١/١١‏ يمكن صياغة 
المعادلة التالية: 
8 -1/ (أ+ج) 


وبناء على ذلك فإن التحقيق (5) هو نسبة عدد الوثائق المدصلة با موضوع 

المسترجعة؛ إلى إجمالى عدد الوثائق المسترجعة من النظام: . 
م-/ «أ+جب) 
وتميل العلاقة بين الاستدعاء والتحقيق لأن تكون تناسبا عكسيا (راجع على 

سبيل المثال 1993 ,792207 عت «#عامهعصة.1). وإن كان فاحمان (1993) سسفددعن؟ ‏ 
قد دحض تلك العبارة بعدة أمثلة؛ فقد تبين لفاجمان أن الزيادة في التحقيق ليس من 
الضروري أن تكون مصحوبة 0 مقابل في الاستدعاء» وأن وار ام 
لا يمكن بحال القول بأنها يترتب عليها دائم| تناقص في التحقيق. والتفسير الحزئي للتتيجة 
التي انتتهى إليها فامان» هو أن استرجاع الوثائق افاطة بر ومين 
الاستدعاء والتحقيقء بينم| يؤثر استرجاع الوثائق غير الصا حة في التحقيق فقط 
(1997 رععجقط:رهك1). 

ومن المفترض أن يقيس الاستدعاء القابلية للاسترجاع الخاصة بنظام استرجاع 
المعلومات» بين) ينبغي أن يقيم التحقيق قدرة نظام استرجاع المعلومات على فصل غير 
الصالح عن الصالح. إلا أن هناك عقبتين رئيستين تمثلان حجر عثرة في حساب هذين 
المقياسين؛ أولاهماء كيف يمكن تعريف الصلاحية وقياسها؟ والثانية كيف يمكن 
التعرف على إجمالى عدد الوثائق الصا حة في النظام؟ 
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مفهوم الصلاحية: 

لقد كان النقاش» وبمزيد من الدقة الجدل. حول معنى الصلاحية طؤيلا 
ومحتدما. وقد قدم ميزارو (1997) 81122850 تاريخا للصلاحية؛ بمراجعة حوالي 
٠‏ بحثاء نشرت عن الموضوع., منذ ما قبل خمسينيات القرن العشرين» حتى 
منتصف تسعينيات القرن نفسه. وعلى الرغم من ذلك حظي الأمر بقدر كبير من 
الاهتمام» ولم يتم الاتفاق حول سبل تعريف الصلاحية» وكيف يمكن قياسها ببساطة؛ 
نظرا لأن الصلاحية» في جوهرها حكم ذاتي» متأثر بكثير من العوامل المترابطة؛ 
فالصلاحية كالحب. إحساس في نظر من يرى. وهي مفهوم لا يمكن وصفه صراحة 
أو التعبير عنه كميا بسهولة. 

وعلى الرغم من ذلكء تم اقتراح عدد ضخم من التعريفات للصلاحية. وقد 
تتبع ساراسفك (1975) 916ع8880, وحلل ولخنص كثيرا من التعريفات المتوافرة 
للصلاحية» وخلص إلى أن فهمنا للصلاحية قد أصبح أفضل بكثير» وأوضح وأعمق 
وأوسع ما كان عليه في أعقاب الحرب العالمية الثانية مباشرة. إلا أن الشوط لا يزال 
طويلا. وقد أعاد شامير, وآيزنبرج» ونيلان صقلذلة همه ععءطدة 85 ءطسقط5 
(1990) النظر في قضية تعريف الصلاحية» وأشاروا إلى أنه لم يتم التوصل بعد إلى 
اتفاق فيم| يتعلق بالتعريف. وكان في اعتقاد هؤلاء الباحثين» أن الصلاحية مفهوم 
متعدد الأبعاد. يتوقف على عوامل داخلية وخارجية. | يستند هذا المفهوم أيضا إلى 
عملية إبداء رأي بشرية ديناميكية. ومن الممكن» على وجه التحديد, التخقق من ثانين 
عاملا مؤثرا في أحكام الصلاحية» وتصنف هذه العوامل في ست فئات: من يصدرون 
الأحكام, والطلبات» والوثائق» ونظم استرجاع المعلومات» وظروف إصدار 
الأحكام» واختياز القياس (1994 ,52615هقط580). وفضلا عن ذلكء يؤثر عامل 
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التعلم» وتسلسل عرض نتائج عملية البحث أيضا في أحكام الصلاحية ,اءنلط»0) 
(1994. فبإمكان من يصدر الحكم أن يتعلم في أثناء عملية الحكم على الصلاحية. 
ومن المحتمل للوثيقة نفسها أن يصدر الحكم بأمها أكثر صلاحية؛ إذا ما قدمت في 
موقع متقدم لا في موقع متأخر في عملية التقييم. وغالبا ما يضيف إلى التعقد المتزايد 
فعلاء والصعوبة والإحباط في الحكم على الصلاحية» قيام شخص ماء خلاف المستفيد 
النهائي (كاختصاصي المعلومات) بالحكم على الصلاحية» وخصوصافي بيئات 
عمليات البحث التي تحظى بالمساعدة» ى) في نظم الخط المباشر. 

فالصلاحية مفهوم فقن نك إلا أنها ظاهرة نسقية وقابلة للقياس ,© <تصهداء8) 
(1990 ,صقلا يت ع<مءؤزك1. ويمكن القول ببساطة أن الصلاحية خاصية تعبر عن 
العلاقة بين الوثيقة واستفسار المستفيد. وبين| يبدو من الصعب إصدار حكم دقيق 
وموضوعي على الصلاحية. فإنه من الممكن الحصول على تقدير لقيمتها. ويتعين على من 
يقومون بالتقييم» أن يضعوا في الوقت نفسه في الحسبان, القضايا التي طرحت ونوقشت 
في هذا القسم الفرعيء عندما يكونون بصدد الحكم على صلاحية نتائج الاسترجاع. 

وبعد أكثر من ثلاثين عاما من نشر مراجعته العلمية الضافية حول الصلاحية 
(1975 6 ؤ58869).: أعد ساراسفك مراجعة علمية من جزأين بالعنوان نفسه إلا 
أنه ميزهما بالجزء الثاني (20078 ن01ع8ة8) والجزء الثالث نذوععهمة8) 
(2007» ليبين أنبم| معاء استطراد لعمله البذري الذي نشر عام 21414 وإن لم يكن 
حينئذ قد عنون بالجزء الأول. وبعد المزيد من المراجعات العلمية لمفمهوم الصلاحية: 
من حيث طبيعته» وتجلياته» ومضامينه» خلص ساراسفك إلى أن الصلاحية» يوضنها 
المفهوم الأساس في استرجاع المعلومات» جوهرية؛ ومن ثم فإن البحث والنقاش 
حول الصلاحية سيظل دائ) في وقته وأوانه. 
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تحديد جميع الوثائق الصالحة في نظام ما: 
يقة تعريف الصلاحية وقياسها مجرد مشكلة واحدة فقطء في حساب 
الاستدعاء والتحقيق. وينطوي المأزق الآخر على تحديد كل الوثائق الصالحة 
لاستفسار ما في نظام ما لاستزجاع المعلومات. ومالم يكن النظام قد أنشئ لأغراض 
تجريبية» فإنه يبدو أن لا سبيل لمعرفة مجمؤع الوثائق الصا حة في النظام» لاستفسار 
معين على وجه التحديد. إلا أن ذلك العدد. المقام في المعادلة: 
8 - / (أ+ ج). لا غنى عنه بالنسبة لحساب الاستدعاء. 

وقد اقترحت عدة طرقء على مر السنين» للتغلب على هذه المشكلة ,ع78ة.1) 
(1999 ,:إ©1813:16 :ع 1600. والتجمع 5001108 واحد من مثل هذه الطرق؛ ففي 
المقام الأول يقوم مستفيدون مختلفون بإجراء عملية البحث نفسهاء على افتراض أنه 
إذا ما تمت عدة محاولات كافية لإجراء عملية البحث؛ فإن معظم. إن لم يكن كل 
الوثائق الصالحة يمكن العثور عليها في النهاية مرة واحدة على الأقل» ثم يتم بعد 
ذلكء تجميع النتائج التي أسفرت عنها جميع عمليات البحث معاء مع استبعاد 
المكررات. ولحساب الاستدعاء حينئذ» يمكن مقارنة نتائج أي من عمليات البحث» 
مقابل هذه الفئة المجمعة من الوثائق الصا حة في النظام. وقد تم تطبيق طريقة التجمع 
هذه في سلسلة مؤتمرات استرجاع النصوص 1101:0, لحساب الاستدعاء 
(1995 ,لقصدئد11)؛ بالإضافة إلى مشروعات أخرى (راجع على سبيل المثشال 
7 ,71111611 يه ع21دا:)). ومن ثم يثار السؤال حول كم عدد عمليات البحث 
التكرارية يتطلب الأمر إجراؤهاء حتى يشعر أولئك الذين يستخدمون طريقة التجمع 
بالثقة بأنه قد تم تجميع ما يكفي من الوثائق الصا حة. 

والنهج الآخر لتقدير إجمالي عدد الوثائق [الصالحة] في نظام ماء هو أن يطلب 
من خبير واحد أو أكثر تجمعهم خبرة إجراء عمليات البحث والمعرفة ال موضوعية» 
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إجراء عمليات البحث. مع الافتراض بأن هؤلاء الخبراء سوف يعشرون على جميع 
الوثائق الصاحة في النظام. ومن الممكن مراجعة النتائج التي أمكن الحصول عليها من 
جانب فئة أخرى من يجرون عمليات البحثء كفئة المبتدئين» مقابل عمليات بحث 
هؤلاء الخبراء؛ لقياس الاستدعاء. ويمكن تسمية هذا النهج بطريقة الخبراء. 

وبالإضافة إلى طريقة التجمع؛ وطريقة الخبراء» تناول كل من لارج وتد 
وهارتلٍ (1999) 112:16 1600 ,ععهآ طريقة الفئة الفرعية 5015564. وفي 
هذه الطريقة» يتم فحص الوثائق الواردة في فئة فرعية صغيرة من مرصد بيانات 
النظام» كلا على حدة. للعثور على الوثائق الصا حة. والافتراض الذي يستند إليه هنا 
هو أن المجموعة الفرعية أو الفئة الفرعية 564<اناة تمثل النظام برمته؛ مما يوحي 
بضرورة تطبيق أسلوب العينة العشوائية» لاختيار الفئة أو المجمؤعة الفرعية. وحينئذ 
يصبح التقدير القائم على الفئة الفرعية هو المقام لحساب الاستدعاء. 

وكا هو واضح. فإن الحصول على مقياس للاستدعاء لتقييم أداء الاسترجاعء 
أشبه بإحصاء عدد الأسماك في البحيرة. والمهمة أقرب للمستحيل؛ نظرا لأن مرصد 
بيانات النظام ديناميكي, دائم التغير. وجميع الطرق التي ناقشناها هناء إنما هي في 
أحسن الأحوال تقديرات جيدة؛ وفي أسوأ الأحوال محصن تخمينات صريحة ,©83786]) 
(1999 ,وع ادغ 00ه1. 


انتقادات الاستدعاء والتحقيق الأخرى: 


لم يتم التوصل» كى| يبدوء إلى إجابات مرضية كافية للسؤالين اللذين سبق 
طرحهماء بشأن الصلاحية» ومجموع عدد الوثائق: الصا حه في نظام ماء إلا أن مزيدا 
من الانتقادات وجهت للاستدعاء والتحقيق كمقياسين للتقييم؛ فقد تمت الإشارة» 
على سبيل المثالء إلى أن الاستدعاء والتحقيق مقياسان غير كاملين للتقييم؛ نظرا لأن 
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عوامل كالتفاعلية» والتكلفة» وسرعة الاسترجاعء ينبغي أيضا أن توضع في الحسبان 
)مر اجع على سبيل المثال 1999 ,17131013 عت 100 ,عع131). كذلك ذهب ملر 
وتجلر (1986) مع1اعء1 قصه 116ئل3 إلى أن: 


الطرق التقليدية لتقييم عمليات البحث عن المعلومات - 
الاستدعاء والتحقيق - قد أغفلت تماما هذا الجانب التوليدي الإبداعي 
لعملية البحث. وبتقييم الناتج وليس العملية» فإن الاستدعاء والتحقيق 
يحدان من فهمنا لعمليات البحث عن المعلومات» ويعجزان عن قياس 
هذه العمليات على نحو فعال. (0.371) 


وبعبارة أخرى, فإن مقابيس أخرى خلاف الاستدعاء والتحقيق, ينبغي أن 
تطبق في تقييم استرجاع المعلومات. وكما أشار سالتون (1992) 581408 فإن 
الافتراض الرئيس وراء استخدام مقاييس كالاستدعاء والتحقيق» هو أن المستفيد 
العادي م يتم باسترجاع كميات كبيرة من المواد الصالحة (نما يسفر عن استدعاء مرتفع) 
اك ا 
وقد لا تتحقق هذه الافتراضات على الدوام؛ ففيا عدا حالات كاسترجاع براءات 
الاختراع» على سبيل المثال فإنه قد لا يكون المستفيدون حريصين على عمليات بحث 
شاملة» الأمر الذي يشكك في صلاحية الاستدعاء كمقياس للتقييم. 

يضاف إلى ذلك» أنه ليست هناك طريقة للتعبير عن الدرجات المختلفة 
للصلاحية عند حساب الاستدعاء؛ فجميع الوثائق الصالحة يفترض عادة أن تكون 
ذات قيمة متساوية» بصرف النظر عم إذا كانت صلاحيتها هامشية أو بؤرية 
(1999 ,لإ"اناط01200)). ولا يمكن تغيير هذا الافتراضء» وخصوصا عندما يكون 
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العدد الإجمالي للوثائق الصا حة في نظام ماء بحاجة إلى تقدير بواسطة الطرق التي 
تناولتاها في .5/١/7 /1/1١‏ 


ويبدو الاستدعاء والتحقيق كمقياسين للتقييم» أبعد ما يكونان عن اللمثالية» ىا 
يبدو الاستدعاء أكثر المقياسين إثارة للجدل. إلا أنه على الرغم من كل الانتقادات 
والجدل» فإن مقياسي الاستدعاء والتحقيق يشكلان الأساس بالنسبة لعمليات التقييم 
المعروفة» لكل من نظم الاسترجاع العاملة والمختيرية أو التجريبية (1992 ,88108). 
وقد تطورت في الوقت نفسه أشكال متعددة لمقياسى الاستدعاء والتحقيق» هبدف 
التخلص مما يكتنف معياري التقييم ارين ارضة التسوود 
الأشكال المختلفة لمقياسي الاستدعاء والتحقيق: . 

لقد تم اقتراح متوسط الاستدعاء أو التحقيق» لدحض افتراض القيمة 
المتساوية لصلاحية الوثائق المسترجعة. ولم تعد الصلاحية في هذه الطريقة خاصية 
ثنائية (أي صالح أو غير صالح) في حساب متوسط الاستدعاء أو التحقيق. وعوضا 
عن ذلك فإن الصلاحية تقاس بمقياس من س من النقاط (س- ”, 5 )١1...‏ لبيان 
مختلف درجات الصلاحية. وإذا ما استعمل مقياس من ثلاث نقاط على سبيل المشال» 
فإنه يمكن إعطاء قيمة من صفر أو ٠.5‏ أو ٠.١‏ لكل وثيقة مسترجعة. ومن الممكن 
بعد ذلك حساب متوسط القيم المعطاة لجميع الوثائق المسترجعة حول موضوع ماء 
بحيث يمكن وضع تفاوت الصلاحية في الوثائق المسترجعة؛ في الحسبان. وليس من 
الضروري أن يقتصر عدد النقاط في المقياس» على ١١‏ أو أقلء إلا أنه يمكن للتقسيم 
الأكووقة إن عق اعولة اتساب و كن دق إذ بس اناف إن يتاب ترط 
الاستدعاء» أصعب من قياس متوسط التحقيق؛ نظرا لصعوبة تحديد العدد الإجمالي 
للوثائق الصا حة في نظام ما. 
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وفي امتداد لهذه الطريقة» غالبا ما يتم حساب متوسط الاستدعاء أو متوسط 
التحقيق» بالنسبة للوثائق المسترجعة حول موضوع ماء المتربعة على القمة س (س- 
ل )ل إذا كاتت النتائج مرتبة طبقيا وفقا للصلاحية المنتظرة. وقد 
طبقت سلسلة مؤتمرات استرجاع النصوص )11818 هذا المقياس على نطاق واسع» 
أي متوسط الاستدعاء أو متوسط التحقيقء عند الحدود القصوى للمخرجات 
(1995 ,مقتصا813]). وقد قامت تشو وروزنتال (1996) لفطادءده80 لسه طن 
بحساب متوسط التحقيق للنتائج العشر المسترجعة المتربعة على القمة» عندما كانتا 
بصلد تقييم نظم استرجاع الإنترنت التافيستا ها715آ118ى» وإكزايت عأك172, 
وليكوس 605[-1. ويكفل متوسط الاستدعاء أو متوسط التحقيق» عند الحدود 
القصوى للمخرجات,. بديلا عمليا لمقياسي الاستدعاء والتحقيق العاديين» وخصوصا 
عناذما كو ع لخر شواركة اانه حامر ننه لفيا كتير العدة: 

والاستدعاء المعياري أو التحقيق المعياري 205::811260؛ شكل آخر 
للاستدعاء والتحقيق» يضع في الحسبان التدابع الذي تقدم به الوثائق المسترجعة 
للمستفيد؛ فمن الممكن مثاليا لنظام استرجاع المعلومات, أن يقدم جميع الوثائق 
الصالحة» قبل عرض أي من الوثائق غير الصالحة. وإذا ما أعطيت القيمة (١)لنظام‏ 
مثالي» والقيمة (صفر) لأسوأ نظام ممكن, ذلك النظام الذي يمكن فيه تقديم جميع 
الوثائق غير الصالحة للمستفيد» قبل تقديم أي وثيقة صالحة» فإن تلك القيمة تصبح 
المعامل في حساب الاستدعاء أو التحقيق المعياريين. وقد وصف كل من كورفيح 
(1997) ععهط]:هخك. وفوسكت (1996) )180511 طريقتين مختلفتين ‏ الحساب 
الاستدعاء المعياري. كذلك يمكن حساب التحقيق المعياري على النحو نفسه. 
والافتراض الآخر بالنسبة لهذا المقياس» هو أن يكون المرء على درايبة بكل الوثائق 
الصالحة في نظام ماء وهو مأزق ممائل بالنسبة لحساب الاستدعاء؛ ومن ثم فإن احتمال 
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هذا المقياس يعاني أيضا من ذلك الافتراض غير المحتمل. وفضلا عن ذلكء فإن 
الاستدعاء أو التحقيق المعياري؛ يتطلب في جوهره ترتيب مخرجات الاسترجاع طبقيا 
وفقا للصلاحية المنتظرة. 

والاستدعاء التسبي هو نسبة الوثائق الصالحة المسترجعة التي فحصها 
المستفيد, إلى عدد الوثائق الصالحة التي يعلم المستفيد بوجودها في النظام © ع):118) 
(1997 ,)"علق أو يمكن أن يود فحصها (1997 ,ع1501188). لنفترض على سبيل 
المثال» أن المستفيد يعتقد أن هناك في النظام ٠١‏ وثيقة صالحة حول استفسار معينء 
وبعد إجراء عملية البحث يسترجع المستفيد عشر وثائق» حكم عليها بأنما صا حة. 
حينئذ يكون الاستدعاء النسبي لعملية البحث هذه ٠١٠‏ بالمئة. ومن الؤاضح أن 
الاستدعاء النسبي قد اقترح بقصد التغلب على المشكلات المرتبطة بالاستدعاء إلا أنه 
هنا أيضاء يظل التساؤل قائأ» كيف يمكن للمستفيد أن يعرف» على سبيل المثال» عدد 
الوثائق الصالحة في نظام ما؟ والإجابة هي ما اقترح في 7/١/7 /١/1١‏ بالنسبة 
لتحديد إجمالي عدد الوثائق الصا حة في النظام (كطريقة التجميع على سبيل المثال). 
وتعاود المشكلة القديمة نفسها الظهور بعد التحول إلى ما يسمى الاستدعاء النسبي. 

ومقياس إي عناكة©17-0, الذي اقترحه سويتس (1969). 577©]5 جمع 


موزون بين التحقيق والاستدعاءء لقياس فاعلية الاسترجاع. ومن الممكن حسابه 
بالمعادلة التالية: 
[2-1 (م8 +1) + 1- 2م8] / 1-1 - 8 
ويستعمل المعامل 6 في هذه المعادلة للتعبير عن التركيز على أي من التحقيق أو 
الاستدعاء؛ فعلى سبيل المثال فإن 1 > 6 يقابل إضفاء أهمية متساوية على كل من 
التحقيق والاستدعاء. و2 800 0.5 > " تقابل إضفاء نصف أو ضعف الأهمية على 
الاستدعاء ا على التحقيق» على التوالي. وكلم| انخفض مقياس إي 8 ارتفع مستوى 


1048 


فاعلية نظام الاسترجاع. وقد طبق مقياس إي» على سبيل المثال» من جانب جريفيث 
ولاكهرست وويلت (1986) 4اع11111 له ,اأسسسنتطءاعسط ركطغتلت»). في 
دراستهم. ويمكن إبداء ملاحظتين بشأن مقياس إي؛ الأولى أنه يمكن أن يضفي 
درجات مختلفة من التركيز على أي من الاستدعاء أو التحقيق. والثانية؛ أنه يضم كلا 
من الاستدعاء والتحقيق في مقياس واحد للفاعلية. وكما سيتبين لنا فيها بعد. فإن 
مقياسا واحدا للتقييم هو المفضل كثيرا في أوساط استرجاع المعلومات. 

وتكفل الأشكال المختلفة للاستدعاء والتحقيق» وجهات نظر وبدائل مختلفة 
لمقياسي التقييم. إلا أن أيا من الأشكال المختلفة لا يمكن أن يتغلب على نحو 
جوهريء وناهيك عن كلي, على المشكلات التي تواجه التحقيق والاستدعاء. ومن ثم 
ظهرت مقاييس تقييم إضافية (كالتسرب 18110014 على المثال) على مر السنين. 


التسرب: 
يعرف التسرب 58110114) الذي طرحه سويتس (1963) 5)ع5889 في البداية» بنسبة 
الوثائق غير الصا حة المسترجعة إلى جميع الوثائق غير الصا حة في مرصد بيانات النظام. 
ويتم تحديد التسرب 79) على النحو التالي باستعمال الرموز الواردة في الجدول 
رقه1/11: 
'8دب/ (ب + د) 
ويقيس التسرب عجز نظام استرجاع المعلومات عن استتبعاد الوثائق غير 
الصالحة من نتائج الاسترجاعء الأمر الذي يسميه روبرتصون (1969) دمكئاسءطم]1 
معامل الشوشرة 18107 20156. وتتراوح قيمة التسرب مابين الصفر والواحد» 
شأءها في ذلك شأن الاستدعاء والتحقيقء إلا أنه كلما انخفضت قيمة التسربء كان 
نظام استرجاع المعلومات أفضل من وجهة نظر التقييم. 
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وكا في حالة حساب الاستدعاء, فإن إجمالى عدد الوثائق غير الصا حة في النظام 
غير معروفء ومن ثم فإن ذلك العدد ينبغي تقديره باتباع الطرق التي سبق أن 
نوقشت بالنسبة لتقدير الاستدعاء. ولا يبدو التسرب بوجه عام مقياس تقييم 
يستخدم بكثافة» على الرغم من أن روبرتصون (1969) 800624505 صرح بأن بياني 
علاقة الاستدعاء بالتحقيق» (بياني يوقع قيم هذين المقياسين) لا يمكن تفسيره 
بسهولة كبياني علاقة الاستدعاء بالتسربء وذهب إلى أن التحقيق ليس بالمقياس المفيد 
للأداء بنفس أهمية التسزب مرتبطاً بالاستدعاء. 


العمومية: 

تعرف العمومية '(862658114 بوصفها نسبة الوثائق في مرصد بيانات النظام» 
الصالحة لموضوع معين. وبناء على الرموز الواردة في الجدول رقم ١/١١‏ فإنع 
(العمومية) يمكن حسابها على النحو التالي: 

ع -(+ ج)/ (أ+ ب +ج +د) 

وكلم| ارتفع مدى العمومية (أو كلما ازدادت كثافة الوثائق الصا حة في مرصد 
البيانات) ازداد ميل عملية البحث للسهولة (1993 تعصعة ١71‏ عت معامدعصهر])» إلا 
أن العمومية» على وجه التحديد» مقياس لحودة مرصد البيانات من منظور الصلاحية» 
وليست مقياسا لآداء الاسترجاع مباشرة. وفضلا عن ذلك» فإنه من الصعب دائم]| 
تحديد عدد الوثائق الصالحة التي لم تسترجع من النظامء أي قيمة ج في الجدول 
رقم .١/١١‏ 


المقاييس الأحادية لتقييم استرجاع المعلومات: 


من بين انتقادات الاسنتدعاء والتحقيق عدم اكتاها كمقياسين للتقييم (راجع 
١ /"/1/‏ "). وهذا هو السبب وراء استعمال الاستدعاء والتحقيق عادة. 
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بالجمع مع- وربما إلى جانب- معايير أخرى لأغراض التقييم. ويمكن للأمر أن يكون 
مثالياء إن كان من الممكن استخدام مقياس تقييم واحد. بإدخال العوامل ال منصلة في 
الحساب. ويكاد مقياس إي «1 يكون مثالا للمقياس الواحد لتقييم استرجاع 
المعلو مات. فقد اقترح كوبر (1973 ,19738) 00006) مقياسا للانتفاع زفالافا'لة 
يقوم على الحكم الذاتي للمستفيد» على نظام استرجاع المعلومات» من حيث فائدته. 
ومن الممكن قياس الانتفاع من النظام بطريقة مختلفة» مادام ذلك يتفق ونظرية كوبر 
للمنفعة؛ فقد طلبت سو (1991) 513» على سبيل المثال» من المستفيدين تقييم الانتفاع 
بننات عمليات البحث. بناء على نوع ما من مقياس ليكرت 1.1164 المكون من سبع 
درجاتء وذلك بالنظر في قيمة نتائج عمليات البحث ككل. وقد تبين لها أن مقياس 
الانتفاع هذاء كان أفضل مقياس قائم بذاته للأداء التفاعلي لاسترجاع المعلومات» من 
بين عشرين مقياسا وقع عليها اختيارها من أجل دراستها. 

كذلك يمكن أيضا تعريف مقاييس الانتفاع بطريقة مختلفة؛ كقيمة الوثائق 
المسترجعة ككلء في مقابل الوقت المستنفدء وتحدد القيمة بالدولارات» والإسهام في 
حل المشكلات (1988 ,7مغصةك1 عت علوعع 2 د5 1988 ,.له أء رعأوءء 2 53). إلا 
أنه أيا كانت الطريقة التي يتم بها تعريف الانتفاع في التقييم» فإن هذا المقيناس يعتمد 
دائما على الحكم الذاتي للمستفيد. وتفضي ذاتية هذا المقياس إلى نفس ما يبديه المهتمون 
من تخوف عند إصدار أحكام الصلاحية» لأجل حساب الاستدعاء والتحقيق. 


مقاييس التقييم الأخرى لاسترجاع المعلومات: 

عقب جريفيث (1986) 611305 يوماء قائلا بأنه من الممكن استخدام ثلاثة 
أرقام فقط في تقييم نظم استرجاع المعلومات؛ عدد الوثائق الصالحة المسترجعة» وعدد 
الوئائق غير الصالحة المسترجعة. وإجمالي عدد الوثائق ف مرصد بيانات النظام. ومن 
الممكن الحصول على هذه الأرقام جميعا دون أي تقدير أو تخمين. ويمكن لنسبة 
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الوثائق الصا حة المسترجعة إلى إجمالي عدد الوثائق في مرصد بيانات نظام ماء أن 
توضح قدرة النظام على العثور على الوثائق الصالحة. وكذلك الحال أيضاء يمكن 
لنسبة عدد الوثائق غير الصا حة المسترجعة إلى إجمالي عدد الوثائق في مرصد بيانات 
نظام ماء أن تبرز القدرة التمييزية للنظام؛ أي القدرة على رفض الوثائق غير الصا حة» 
إلا أن قليلا من مشروعات التقييم وضعت فكرة جريفيث في حيز التطبيق. 

وقد مرت مقاييس التقييم بالنسبة لاسترجاع المعلومات برحلة طويلة ما تزال 
مستمرة. ومن بين جميع المقاييس القي نوقشت في هذا السياق؛ يحظى الاستدعاء 
والتحقيق بمعظم الاهتمام» فضلا عن معظم النقد أيضا. إلا أن هذين المقياسين هما 
المقياسان بحكم الواقع بالنسبة لمعظم جهود التقييم؛ نظرا لأنه من السهل تفسيرهما 
من حيث استرجاع الوثائق المرغوب فيهاء ورفض الوثائق الغريبة (1992 ,هه][58). 
وسوف يظل الاستدعاء والتخقيق هما المقياسان الرئيسان للتقييم» بالنسبة لاسترجاع 
المعلومات. مالم تتطور بدائل أفضل منههما وتثبت جدارتها. 


معابير تقييم نظم استرجاع المعلومات: 

الاستدعاء والتحقيق وغيرهما من المقايبس الأخرى التي سبقت مناقشتهاء إن| 
هي لتقييم أداء الاسترجاع في الأساس. وأداء الاسترجاع كا يبدو» جانب واحد فقط 
من جوانب استرجاع المعلومئات» وذلك على الرغم من أنه ى] سبق أن تبين لناء يوليه 
المستفيد النهائي أقصى اهتمام. إلا أنه لتكوين نظرة كاملة لمدى كفاءة أداء نظام 
استرجاع المعلومات» ينبغي وضع مقايبسن أخرى خلاف تلك الخاصة بتقييم أداء 
استرجاع المعلومات في الحسبان. وينبغي استخدام مقاييس مختلفة لمختلف أنواع نظم 
استرجاع المعلومات. وتنظر الأقسام التالية في معايير التقييم بالنسبة لكل نوع من 
الأنواع الأربعة لنظم استرجاع المعلومات؛ وهي نظم الخط المباشرء ونظم الفهارس 
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المتاحة على الخط المباشر (02469)» ونظم استرجاع الإنترنتء. ونظم استرجاع 
الوسائط المتعددة (وإن كانت نظم استرجاع الوسائط المتعددة لم تعالج كنوع متميز في 
الفسول انارق )1 


معايير تقييم نظم الخط المباشر: 

لقد كان لنظم الخط المباشر أطول تاريخ, بين الأنواع الأربعة الرئيسة لنظم 
استرجاع المعلومات (راجع الفصل الثامن»» ومن ثم فإنبا كانت موضوع كثير من _ 
دراسات التقييم. كا أن معايير تقييم نظم الخط المباشر مصممة بطرق مختلفة. 

ووفقالما ذهب إليه لانتكستر ووورنر (1993) #تعصعة؟7 لض #عاقهءممل 
فإنه من الممكن لعمليات تقييم نظم الخط المباشرء أن تتم على ثلاثة مستويات: )١(‏ 
عمليات تقييم الفاعلية» (؟) عمليات تقييم فاعلية التكلفة» (؟) عمليات تقييم عائد 
التكلفة. ويضع المستوى الأول» عمليات تقييم الفاعلية 8©55 6616176 في الحسبان 
كلا من التكلفة» والوقت» وجودة النظام. وتحاول عمليات التقييم هذه الكشف عما 
إذا كان النظام يعمل بفاعلية فيم| يتعلق بحاجة المستفيدين. ويربط المستوى الثاني» 
عمليات تقييم فاعلية التكلفة و5عهع19]© 6051-6116© عامل التكلفة بفاعلية النظام» 
بحيث يمكن المقارنة بين نظامين مختلفين لاسترجاع المعلومات بسهولة؛ في هذا 
المستوى. فكم على سبيل المثال» تبلغ تكلفة استرجاع وثيقة صالحة من نظام ما؟ 
ويمكن للضرب نفسه من المقارنة أن يكون من الصعب إجراؤه في المستوى الأول» 
نظرا لأن تلك المقايبس غير معيارية. أما المستوى الثالث» تقييم عائد التكلفة -050© 
عط فيذهب إلى ما هو أبعد من المستويين السابقين» وذلك بتقييم تكلفة تشغيل 
' نظام استرجاع المعلومات» مقابل العائدات التي تتحقق نتيجة لوجود النظام. وكل]ا 
ارتفع مستوى التقييم» ازداد تعقد معايير التقييم. وتميل معايير المستوى الأول (أي 
زمن الاستجابة أو تغطية مرصد البيانات على سبيل المشال) لأن تكون مباشرة أو 
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صريحة. وتحتاج مقاييس المستوى الثاني إلى بعض الحسابات. وفي مقابل ذلك تتطلب 
معايير المستوى الثالث. إصدار الأحكام وتوافر البراهين» على نحو أكثر بكثير من 
التقييم البسيط. ومن الممكن تطبيق معايير التقييم؛ في جميع المستويات الثلاثة» في 
مشروع تقييم واحدء غير أنه في التطبيق العملي» تستخدم مقاييس المستويين الأول 
والثاني» ومقاييس المستوى الأول على وجه الخصوص. في معظم الأحيان. في تقييم 
نظم الخط المباشر؛ نظراً لجدوى هذه المقاييس وقابليتها للتطبيق. 

وعلى الرغم من وضع معايير مختلفة لتقييم نظم الخط المباشر يبدو أنه قدتم. 
التوصل إلى إجماع حول أي الجوانب ينبغي أن تخضع للتمحيص. وقد لخص لانكستر 
وفاين (1973) 8ع:3ه"1 قصة مع)و3222ر,آ هذه الجواتب ف شكل ستة معايير: )١(‏ 
التغطية» (؟) الاستدعاء» (”) التحقيق» (5) زمن الاستجابة» (5) جهد المستفيد» 
(1) شكل المخرجات. ومن عجب. أن نرى أن القدرة على إجراء عمليات البحث لم 
تدخل ضمن هذه المجموعة من معايير التقييم. 

والتغطية معيار تقليدي لتقييم مرصد بيانات النظام. وتشمل الأوجه المحددة 
لتغطية مرصد البيانات أنواع الوثائق (كبراءات الاختراع» ومقالات الدوريات» 
وتقارير البحوث على سبيل المثال)» وعدد الوثائق» وتتابع التجديد, والمدى الزمني 
للتغطية الراجعة. وتحدد تغطية مرصد بيانات النظام ما يمكن استرجاغه في| 
بعد من النظام. 

والاستدعاء والتحقيق جزء من معايير التقييم لقياس أداء الاسترجاع. وقد 
أصبح هذان المقياسان» كما بينا في /١/1١‏ ؟ المكونات التقليدية في معظم جهود 
التقييم» إلا أنه لم يتم وضع مواصفة معيارية لمعدلات الاستدعاء والتحقيق المرضية» 
وذلك لسببين؛ أوهما أنه من الممكن للمستفيدين المختلفين أن تكون لهم توقعات 
مختلفة لكل من الاستدعاء والتحقيق, في الظروف المختلفة؛ فإذا كان هناك على سبيل 
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المثال مستفيد ينوي إعداد مراجعة علمية للوضع الراهن للمعرفة في موضوع ماء فإن 
الاستدعاء الوعفم يمكن أن يكرن شر المترقم وإذا كان المنشفيد لا قم إلا بأسدث 
التطورات في مجال ماء فإنه يمكن للتحقيق المرتفع أن يكون هو المتوقع. والسبب 
الآخر لغياب مواصفة معيارية لمعدل الاستدعاء والتحقيق الذي يمكن قبوله. هو 
علاقة التناسب العكسي التي يفترض وجودها بين المقياسين؛ فممن الممكن للزيادة في 
أحدهما أن تفضي إلى تناقص في الآخر. ومن ثم فإنه من الصعب إيجاد حد أمثل لكل 
من لاخر عاء و التو رصاق إن ذلك آن لسن رمد يثاقات النظلام باثيره عل 
وضع حد للاستدعاء والتحقيق المرضيين. ومن الممكن لمعدلات التحقيق المنخفض 
أن تكون أقل قابلية للتغاضي عنهاء في مراصد البيانإت الأكبر» مما هي عليه في مراصد 
البيانات اللأصغر. فمن الممكن على سبيل المثال لمستفيد ما أن يكون على استعداد للنظر 
في ستين تسجيلة مسترجعة» للتحقق من أن بينها عشرون صا حة: إلا أنه قد يكون أقل 
استعداداً بكثير» لأن ينظر في ستمئة تسجيلة للعثور على مثنين؛ على الرغم من أن 
معدل التحقيق في كلا الحالتين» قد يكون واحداً ("" بالمئة) © «عأمهعصهر1) 
(1993 ,تعصة !7 

ويدل زمن الاستجابة على الوقت المستنفد بين تقديم الاستفسار وتلقي 
النتائج. ويبدو هذا المعيار لا غنى عنه» وخصوصا في نظم الخط المباشر في أيامها 
المبكرة» عندما كانت تقنيات المعلومات (كالاتصالات بعيدة المدى» وطاقة الحاسبات 
على سبيل المثال) في مرحلة طفولتهاء وكان استرجاع المعلومات» اعتمادا على نظم 
الخط المباشر باهظ التكلفة. فإذا كان بإمكان نظام استرجاع المعلومات تجهيز 
الاستفسارات بسرعة. فإنه يمكن الحد من تكلفة استخدامه. الأمر الذي يفسر أهمية 
وجود هذا المعيار في التقييم. 
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وينطوي جهد المستفيد كمعيار للتقييم» على عدة عناصر جميعها يقيس مقدار 
الجهد الذي يتعين على المستفيد أن يبذله. لإجراء عمليات البحث في بيئة الاسترجاع 
على الخط المباشر؛ فكم من الوقت, على سبيل المثال» يستغرقه إلمام المستفيد بالنظام أو 
التآلف معه؟ ما مدى تعاطف تفاعل المستفيد مع النظام؟ أي أنواع الدعم: 
(كالموجزات الإرشادية المطبوعة, أو المساعدة على الخخنط المباشر على سبيل المشال) 
تتوافر للمستفيد؟ وكلما قل الجهد الذي يحتاج المستفيد إلى بذله. كان النظام أفضل. 
ومن الخواص الفريدة لنظم الخط المباشر أن اختصاصيي المعلومات كوسطاءء؛ غالبا 
ما يجرون عمليات البحث نيابة عن المستفيدين النهائيين» كا أخهم مدربون على نحو 
أفضل من تدريب هذه الفئة الأخيرة. وينبغي تذكر هذا الاختلاف» عندما يكون المرء 
بصدد النظر في عامل جهد المستفيد» في التقييم. 

ويمثل شكل المخرجات المعيار الأخير, الذي وضع للتقييم في نظم الخط 
المباشر؛ فمن الممكن تقديم مخرجات عمليات البحث على الخط المباشر بطرق مختلفة 
(كالمعلومات الوراقية فقط) أو المعلومات الوراقية مصحوبة بمستخلصات, على 
سبيل المثال). وعادة ما تكفل نظم الخط المباشر الكثير من خيارات المخرجات,. إلا أنها 
لا ترتب تلقائيا نتائج البحث طبقيا؛ نظرا لأن استخدام مقومات الترتيب الطبقي 
(كالأمر 241015 ني ديالوج ©141:0 4 على سبيل المشال) عادة ما يكون باهظ 
التكلفة. وعادة ما تقدم نتائج الاسترجاع من نظم الخط المباشر» في ترتيب زمني 
تنازلي؛ أي أن تأتي أحدث تسجيلات أضيفت إلى مرصد البيانات في الصدارة. وكما 
تبين لنا في /٠١‏ 7/ 7/ 25 فإن المرونة هي الكلمة المفتاح للحصول على أفضل تقييم في 
هذا الصدد. 

وقصارى القولء. فإن التغطية؛ والاستدعاءء؛ والتحقيقء وزمن الاستجابة: 
وجهد المستفيد» وشكل المخرجات,. قد استخدمت كمعايير تقييم لنظم الخط المباشرء 
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على الرغم من وجود بعض مظاهر الاختلاف أحيانا. ويمكن هذه المعايير أن تكفل 
أيضا أساسا لتقييم الأنواع الأخرى لنظم استرجاع المعلومات. 
معايير تقييم الفهارس المتاحة على الخط المباشر: 

تمثل الفهارس المتاحة على الخط المباشر 08465. المصممة للعثور على 
المعلومات الوراقية المتعلقة بمجموعة مكتبة ماء نوعا فريدا من نظم استرجاع 
المعلومات. وقد تطورت معايير التقييم الخاصة بهذه الفئة من النظمء في المقام الأول 
عن طريق الدراسات المقارنة» ويبدو التقرير الذي أعده هايلدرث طاء11110 
(1982): هو الأقوى أثرا في هذا التطور. بل إن جونز 10565 (في ,1982 رطاء 11110 
1ة.م) قد تكهن بأن أي جهد تال في هذا المجال.م يكن بمنأى عن التأثر بتقرير 
هايلدرث. وقد شكل الإطار الذي قدمه في هذا التقرير» فعلا الجهود التي تلت. في 
تقييم الفهارس المتاحة على الخط المباشر (راجع على سبيل المثال :1987 رععانناه0'1 
3 ,53151208) وذلك على الرغم من أن البحث لم يقصد به أن يكون تقييم|ا لعشرة 
فهارس متاحة على الخط المباشر» تمت دراستها (1985 ,)©111147). وبعد استشارة 
البحوث الصا حة في الموضوع (مثل 1982 ,طا15:105), أعد أورورك عتلعناه0'1 
(1987), لأغراض التقييم» قائمة مراجعة» من 40 سؤالاء مقسمة على حمس فئات 
هي: )١(‏ المخواص التشغيلية» (7) نقاط الوصولء (””7) خواص البحث؛ (4) خواص 
العرضء (0) خواص مساعدة المستفيد. ومن الممكن لهذه الفئات الخمس أن تشكل 
على نحو معقول. معايير تقييم للفهارس المتاحة على الخط المباشر. 

ويتعلق معيار الخواص التشغيلية بكيفية تفاعل المستفيد فعلا مع الفهرس المتاح 
على الخط المباشر؛ كيف. على سبيل المثال» يصل المستفيد إلى النظام؟ هل يكفل النظام 
للمستفيد اختيار هدف (كمجموعة المكتبة المحلية» أو مجموعة تكتل للمكتبات» على 
سبيل المثال) لإجراء عمليات البحث. بالإضافة إلى الخيار الافتراضي 06181014؟ هل 
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بإمكان المستفيد تعديل البحث أو تغيير أوضاع النظام الافتراضية (كعرض 
التسجيلات الموجزة على سبيل المثال)؟ هل من السهل بالنسبة للمستفيد الانتقال من 
مستوى عرض إلى آخرء أو من إحدى التسجيلات إلى ما تليها أو ما سبقتها؟ ولقد 
كانت واجهة التعامل 184674866 (أي لغة إصدار الأوامر في مقابل الاختيار من قائمة 
الخيارات) من الموضوعات الجوهرية عندما وضعت معايير التقييم تلكء إلا أنها تبدو 
أقل صلاحية بالنسبة للفهارس المتاحة على الخط المباشر في الوقت الراهن؛ نظرا لأن 
قليلا من هذه النظم لا يزال يطبق لغة إصدار الأوامر. ولقد كان للتحول مين 
الفهارس البطاقية إلى الفهارس المتاحة على الخط المباشرء أثره البالغ في تفاعل المستفيد 
مع النظام» الأمر الذي يبدو مبررا رئيسا لاختيار هذا المعيار لتقييم الفهارس المتاحة 
على الخط المباشر. 


وتحدد نقاط الوصول كيف يمكن البحث في معلومات الفهارس المتاحة على 
الخط المباشرء وتشكل معيارا آخر لتقييم هذا الشكل من الفهارس؛ ففي السنوات 
المبكرة لتطور هذه الفهارس (أيْ ثانينيات القرن العشرين) كان اسم المؤلف». 
والعنوان» ورقم الاستدعاء ##اعطصنه للوع. والرقم المعياري الدولي للكتاب 
رلل151) تتعطصسساة لم20 2020هاذ لهده هم رعغسل. والر قم المعياري الدولي 
للدورية (511ك15آ) «اءطتصداة ل[دأتءع5 0ختملسصماك لقممأمصععامل هي نقاط 
الوصول المألوفة. ثم أضيفت الكلمات المفتاحية؛ ورؤوس الموضوعات بعد ذلك. 
ومن الناحية النظرية» فإنه كلما زاد عدد نقاط الوصول التي يكفلها الفهرس المتاح على 
الخط المباشر» كان من الأيسر على المستفيد العثور على المعلومات في النظام, إلا أن 
بعض نقاط الوصول (كالرقم المعياري الدولي للكتاب 18518171» ورؤوس الموضوعات 
على سبيل المثال) لا تستخدم بكثافة» لأن المستفيدين» وخصوصا المبتدثين منهم, لا 
يعرفون الكثير عن مضمون هذه النقاط. وفي مقابل ذلكء. فإن نقاط الوصول في حد 
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ذاتهاء لم تصبح معيارا لتقييم نظم الخط المباشر؛ نظرا لأن هناك الكثير من هذه النتقاط 
في بيئة الاسترجاع هذه. ومن الممكن اختيار البحث بالحقل» ضمن مقومات البحث» 
بدلا منهاء لتغطية البعد الخاص بنقاط الوصول. 

وتختلف خواص الببحث في الفهارس المتاحة على الخط المباشرء من نظام لآخر. 
وعندما يتم تقييم الفهارس المتاحة على الخط المباشر» من منظور خواص البحث» تتم 
مراعاة عناصر متعددة؛ أوطا أي أنواع مقومات البحث تحظى بالدعم؟ هل جميع 
المعاملات البولينية الثلاثة متاحة؟ ماذا عن البحث بالبترء والبحث بالتقارب؟ ثانياء 
هل يكفل النظام أي خنواص تتصل بالبحثء كقائمة رؤوس الموضوعات. على الخنط 
المباشرء والإحالات» ومقترحات الارتفاع بمستوى عمليات البحثء على سبيل 
المثال؟ ثالثاء هل يمكن للمستفيدين تحديد عمليات بحثهم بسنة النشرء أو نوع 
الوثيقة» أو ما شابه ذلك؟ وكلما زادت الخيارات التي يمكن للنظام دعمها كان 
النظام أفضل. 

ويتم اختيار خواص العرضء وهي مفهوم أعرض من خيارات المخرجات؛ 
كمقياس لتقييم الفهارس المتاحة على الخط المباشر. ومن الممكن تحليل هذا المعيار إلى 
طول التسجيلة (أي العرض الموجز أو الكامل على سبيل المثال)؛ وعدد التسجيلات 
في كل قائمة» والخواص الأخرى المتصلة بالعرض. كذلك يمكن عرض التسجيلات 
كاملة بصيغ مارك 214140, وهذه خاصية تستخدم في معظم الأحيان» من جانب 
اختصاصيي المعلومات. وقد طرح أورورك (1987) عكاتنناه0"1 المزيد من الأسئلة 
المحددة لاختبار جودة عرض الفهرس المتاح على الخط المباشر. فهل يمكن على سبيل 
المثال» للنظام أن يعرض تلقائيا التسجيلة عندما تكون هي الإجابة الوحيدة المصطلح 
البحث؟ هل التيجان (مثل 11 للعنوان» على سبيل المثال) واضحة في حد ذاتهاء في 
حالات العرض المميزة للتسجيلات؟ هل تخلو حالات عرض التسجيلات من 
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المختصرات. والأكواد» والمصطلحات الخاصة؟ وفضلا عن ذلك» يمكن توجيه أسئلة 
حول نوع الحرف وأسلوبه وحجمه أو أشكال الحروف وأحجامها المستخدمة» في 
حالات عرض نتائج البحث في الفهرس المتاح على الخط المباشر. فلا يوصي على سبيل 
المثال بكل أحجام الخروف الكبيرة» وأنواع الحروف الصغيرة (كبنط ٠١‏ مثلا) على 
سبيل المثال» لعرض البيانات في الفهارس المتاحة على الخط المباشر. 

وتشكل مساعدة المستفيد معيارا آخر لتقييم الفهارس المتاحة على الخط المباشر. 
وكلا ازدادت المساعدة التي يمكن للنظام تقديمها للمستفيد» تراجعت احتالاات 
شعور المستفيد بأنه لا حول له ولا طولء عندما يتفاعل مع الفهرس المتاح على الخنط 
المباشر. ومن الممكن تصميم مقومات كثيرة لمساعدة المستفيدين من هذا الشكل من 
الفهارس. وتشمل الأمثلة رسالة تمهيدية تصف الفهرس المتاح على الخط المباشر بوجه 
عام وقائمة بالملفات التي يمكن الوصول إليها أو الحقول القابلة للبحث؛ وتفسيرات 
رسائل الخطأء والتوعية على الخط المباشر» والمساعدة المتصلة بعملية بحث بعينها على 
الخط المباشر. كذلك ينبغي مراجعة الفهرس المتاح على الخط المباشر أيضاء لمعرفة ما 
إذا كان بإمكانه بيان الخلفية التاريخية للبحث, على سبيل المثال» وما إذا كان يقدم 
تعقيبات إجرائية أو إرشادية بشكل روتيني. ولا ينبغي وضع أي افتراضات حول 
تآلف المستفيد مع النظام» عند مناقشة مساعدة المستفيد. وينبغي أن تكون رسائل 
المساعدة واضحة وبسيطة ودقيقة. 

وقد تطورت معايير التقييم الخمسة هذه في ثانينيات القرن العشرين» عندما 
بدأ استخدام الفهارس المتاحة على الخط المباشر في المكتبات. وقد تم إدخال تحسينات 
وخواص جديدة» ينبغي أن توضع في الحسبان في تقييم الطبعات الحديثة من الفهارس 
المتاحة على الخط المباشر» وخصوصا الجيل الناشئ. فمعظم الفهارس المتاحة على الفط 
المباشر متشابكة الآن» على سبيل المثال» بحيث تكفل التعامل عن بعدء من المنزل أو 
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المكتب أو أي أماكن أخرى خلاف المكتبة» فهل التعامل عن بعد ملائم؟ هل تتوافر 
أشكال دعم ملائمة لمساعدة المستفيد في التعامل عن بعد؟ ومن ناحية أخرىء فإنه ى| 
بينا في 4/ ”» يقوم عدد كبير من الفهارس المتاحة على الخط المبائبر الآن» مقام بوابات 
لمصادر معلومات ونظم أخرى لاسترجاع المعلومات. ف المقومات المتاحة 
للمستفيدين للإفادة من هذه الخاصية؟ وينبغي أن تحظى هذه الخواص والتطورات 
الجديدة للفهارس المتاحة على الخط المباشر بالاهتمام لأغراض التقييم» بالإضافة إلى 
المعايير الخمسة التي تناولناها في هذا السياق. 

ولقد اكتسب ما يسمى بالجيل التالي من الفهارس المتاحة على الخط المباشر 
فعلاء خواص جديدة لم تتوافر في الطبعات المبكرة من هذه الفهارس. وتشمل نم اذج 
مثل هذه الخواص التلقيم المرتد الخاص بالصلاحية» وترتيب نتائج عمليات البحث 
طبقياء والبيئة المعدلة للتصفح. ومراجعة هجاء استفسارات البحث ,7قداء)اصسة) 
(2007 ووععطاعوط/ةا :2006 ,ععو8 عق قتاع 5ا. ويتم إجراء تقييم الجيل التالي متوق 
الفهارس المتاحة على الخط المباشرء الآن في فعظم الأحيانء عند تقييم الفهرس المناح 
على الخط المباشر حديث النشأة (ر اجع على سبيل المثال عق فهتسمعصتزآ رمقصساءغسصة4 
0 ,05016ن) عت 700قطصرم.آ :2006 رععوط) »ومع ذلك فإنه م يوضع بعد إطار 
جديد لهذا الفرص. إلا أن هذا الموقف سوف يتغير ولاشكء. نتيجة لتطبيق المزيد من 
خواص الجيل التالي من الفهارس المتاحة على الخط المباشرء وخصوصا عندما أعرب 
كثيرون (مثل» 2007 ,لإ©:213:51 :2006 ,تطنا»5ة8) فعلا عن مخاوفهم بشأن مصير 
هذا النوع من الفهارس في ظل جوجل العملاق. 


معايير تقييم نظم استرجاع الإنترنت: 
تناول عدد قليل نسبيا من مشروعات التقييم» نظم استرجاع الإنترنت» أحدث 
الأعضاء في أسرة نظم استرجاع المعلوماتء على الرغم من أن بعض الباحثين (مثل 
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و0 طعاعآ :1996 ,أستسممتطععمودكلا عت عساط :1996 ولقطادءده1 © نط 
9 ,5217251878 © ممغطواء.1 :1995) حاولوا اختبار أداء استر جاع هذه الفئة 
من النظم. ولما كان أداء الاسترجاع يمثل جانبا واحدا فقط لنظم استرجاع 
المعلومات» فإن الأبعاد الأخرى لنظم استرجاع الإنترنت ينبغي أن: عع أيضافي 
الحسبان في التقييم. 

وقد اقترحت تشو وروزنتال (1996) [48مءوهم1 تنه طن إطار تقييم 
الحركات بحث العتكبوتية العالمية» النوع الغالب لنظم استرجاع الإنترنت» حتى 
وقت تأليف هذا الكتاب. وهذا الإطار مشتق من معايير تقييم سبعينيات القرن 
العشرين» التي وضعها لانكستر وفاين (1973) «ع:37ة1 مسق ««عأكقءع صما لنظم 
الخط المباشرء مع إضافات ومراجعات مصممة خصوصًا لنظم استرجاع الإنترنت. 
ونظرا للتغيرات التي طرأت على نظم استرجاع الإنترنت بوجه عام, تجاوز الزمن الآن 
بعض الجوانب المحددة في معايير التقييم الشاملة الخمسة (أي تكوين كشافات 
العنكبوتية» وقدرات البحثء وأداء الاسترجاع, والمخرجات» وجهد المستفيد) وقت 
إجراء الدراسة» إلا أن الإطار النظري لا يزال صا حا لتقييم نظم:استرجاع الإنترنت. 

وتكوين الكشافات في نظام استرجاع المعلومات» عنصر مهم للتقييم؛ نظرا لأن 
محتوى الكشافات يحدد كيف يمكن استرجاع ما يشتمل عليه النظام من معلومات. 
فكلا رجه طني اجيف ل المعيوية عل نسيل الكال:افدإن فهات المتعرية 
وليس صفحات العنكبوتية نفسهاء هو ما تتم مراجعته لاسترجاع المعلومات. 
والتغطية» وتتابع التجديد» وقطاعات وثائق الإنترنت المكشفة (كالعنوان بالإضافة إلى 
السطور الأولى» أو الوثيقة برمتهاء على سبيل المثال) هي العناصر الثلائة التي يتم 
اختبارها. وبينا يتوقف مدى المكونات الثلاثة إلى حد بعيد» على طاقة العتاأدومدى 
تطورهء والبرمجيات التي تدير الكشاف أو مرصد البيانات» فإن التغطية الضخمة» 
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والتجديدات المتتابعة» وتكشيف النصوص الكاملة» ليس من الضروري أن تسفر عن 
نظم لاسترجاع الإنترنت» أفضل من المقاييس الأخرى؛ فهناك عوامل أخرى 
(كواجهة التعامل ومقومات البحث عن سبيل المثشال) تنهض بدور في جودة نظم 
اننم عا الإنترنت. 
وتشكل مقومات البحث معيارا آخر لتقييم نظم استرجاع الإنترنت؛ نظرا لأن 
الاختلاف هو القاعدة وليس الاستثناء في هذه الحالة. ومقومات البحث الأساس 
والمألوفة قد لا تكون موجودة في معظم نظم استرجاع الإنترنت. ومن ناحية أخرى. 
فإن مقومات الاسترجاع (كالبحث المشوش على سبيل المثال) التي كان من الممكن أن 
نجدها فقط في المختبرات في الماضي» تطبق الآن في بعض نظم استرجاع الإنترنت. 
“فنظام استرجاع الإنترنت الكفء ينبغي أن يتضمن مقومات البحث الأساس» انيم 
ألفها المستفيدون» وتشمل المنطق البوليني» والبحث بالعبارات» وإمكانية التحديد 
(كالتحديد بالحقل على سبيل المثال). ولا كانت مقومات البحث في نظام استرجاع 
الإنترنت» هي التي تتحكم في أدائه في النهاية» فإن من شأن غياب هذه المهام الأساس 
أن تعوق النظام بشدة. 
وعادة ما يتم تقييم أداء الاسترجاع بثلاثة معايير؛ هي التحقيق» والاستدعاءء 
وزمن الاستجابة. وبين| يمكن قياس هذه المتغيرات الثلاثة جميعا بطريقة كمية؛ فإنه 
ينبغي مراعاة المزيد من الحيطة والحذر» عندما يكون المرء بصدد الحكم على صلاحية 
المواد المسترجعة؛ وتقدير إجمالي عدد الوثائق الصا حة لموضوع بعينه» في نظام قائم على 
شبكة. ونظرا لأن تمثيلات أو بدائل وثائق الإنترنت (كالملخصات أو الاقتباسات على 
سبيل المثال) يتم إعدادها بوسائل آلية في غالب الأخيان» فإن أحكام الصلاحية 
القائمة على مثل هذه التمثيلات» يمكن أن تسبب المزيد من المخاوف بشأن إمكانية 
التعويل عليها. يضاف إلى ذلك أن الطابع الديناميكي المتقلب للإنترنت يجعل من 
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الصعب تقريباء تحديد إجمالي عدد الوثائق الصاحة في نظام لاسترجاع الإنترنت. ومن 
ثم؛ فإن حساب الاستدعاء أصعب في بيئة الإنترنت» ما هو عليه في الأنواع الأخحرى 
من نظم استر جاع المعلومات. إلا أن أوبنهايم ورفاقه (2000) .21 © ,تستأعطمهعمم0) 
يرون أن الاستدعاء النسبي يمكن حسابه باتباع الطريقة التي اقترحها كلارك وويليت 
(1997) 57111©16 320 ع01312) عندما كانا بصدد تقييم أداء نظم استر جاع 
الإنترنت. وفيا يتعلق بزمن الاستجابة كأحد عوامل الأداء. فإنه في سبيله لأن تتراجع 
أعميته نظرا لأن نظم امنترجاع الإنترنت تزداد تحسنا مْن حيث طاقة التجهيز. 

وينبغي النظر في المخرجات كمعيار للتقييم بالنسبة لنظم استرجاع الإنترنت» 
وذلك من ثلاث زواياء هي إمكانية الوصول أو التعامل» والمحتوى» والشكل. 
وبفضل خاصية الروابط الفائقة» يستطيع المستفيد الوصول إلى الوثائق الكاملة لناتج 
الاسترجاعء إذا كانت الروابط تعمل على النحو السليم. إلا أن هناك روابط مختلة» 
كالروابط المنتقطعة (كالروابط بالمواقع التي تغيرت المحددات الموحدة لأماكن المصادر 
5 الخاصة بهاء على سبيل المثال): أو الروابط الميتة (كالروابط بالمواقع التي لم تعد 
متاحة» على سبيل المثال). وينبغي للنظام المثالي لاسترجاع الإنترنت,. أن يجعل عدد 
الروابط المختلة في حده الأدنى» وبذلك يكفل الحد الأقصى لومكانية الوصول للنتائج 
النهائية. ويتحدد محتوى المخرجاتء إلى حد ماء تبعاً للطريقة التي بني بها نظام 
استرجاع الإنترنت؛؟ أي ما إذا كان النظام يقتطف مجرد اقتطاف, أم يكشف فعلا مأ 
يتضمنه عند بناء مرصد بياناته؟ وينبغي أن تكون الإجابة واضحة؛ فالمقتطفات لا 
تكفل مساعدة تذكر للمستفيد في تحديد”موضوع أو محتوى “655 اناوطة النتتائج 
المسترجعة. وهناك جانب آخر يتصل بمحتوى المخرجات؛ وهو مقدار التكرار في 
التتائج. ولا يستطيع سوى بعض ما وراء نظم استرجاع الإنترنت» في الوقت الراهن» 
التخلص من المكررات. إلا أن المخاوف بشأن أشكال مخرجات نظم استرجاع 
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الإنترنت» قل) تمثل قضية ة تذكر؛ نظرا لأن النظم تميل لأن تحدد سلفا جميع أشكال 
المخرجات المحتملة» ومن الممكن الاطلاع على الوثائق؛ الأصلية التي تمثلها 
المخرجات بسهولة إذا رغب المستفيد في ذلك» ومن ثمء فإن إمكانية الوصول 
والمحتوى هما خاصتا المخرجات الفريدتان والمهمتان, بالنسبة لتقييم نظم 
استرجاع الإنترنت. 

ويدل جهد المستفيد في السياق الراهن؛ على التوثيق وواجهة التعامل؛ نظرا لأن 
هذين العاملين يؤثران على نحو جوهري في جهود المستفيدين» في الإلمام بنظم- 
استرجاع الإنترنت»؛ والإفادة منها؛ فالتوثيق المعد جيداء وواجهة التعامل التي 
تتعاطف مع المستفيد» ينهضان بدور لا يستهان به في اختيارات المستفيدين لنظم 
استرجاع الإنترنت. وعلى عكس الأنواع الأخرى لنظم استرجاع المعلومات. فإن نظم 
استرجاع الإنترنت مجانية بوجه عام» ولا تبدو أوجه التمييز في| بينها واضحة» ومن ثم 
فإن جاذبية أي من نظم استرجاع الإنترنت» يتم التعبير عنها للمستفيدين» عن طريق 
واجهة التعامل والتوثيق في المقام الأول. وبعبارة أخرىء فإن المستفيدين لن يقع 
اختيارهم على نظام لاسترجاع الإنترنت» مالم يكونوا يشعرون بالراحة مع واجهة 
التعامل الخاصة به ومالم يكونوا قادرين على قراءة واستيعاب توثيقه عندما 
يستشيرونه. وقد حاولت نظم استرجاع الإنترنت كفئة» الحد من جهود المستفيدين» 
بتطبيق أسلوب تعبئة الاستهارات» والطرق التصويرية للتفاعل» ويشوفير مقومات 
المساعدة على الخط المباشر. وعند تقييم نظم استرجاع الإنترنت من وجهة نظر جهد 
المستفيد» فإن المرء بحاجة لأن يختبر» على وجه المخنصوص. ما إذا كانت الشاشة مزدحمة 
جداء أو ما إذا كانت رسائل المساعدة مغرقة في التقنية أو الإيجاز؛ نظرا لأن مثشل هذه 
المخاوف تبدو عادية بالنسبة لبعض النظم. ومن ناحية أخرىء يختلف المستفيدون من 
نظم استرجاع الإنترنت» عن أولئك الذين يفيدون من النظم الأخرى لاسترجاع 
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المعلومات. فهم أكثر الفئات تنوعا من حيث مهارات وخبرات استر جاع المعلومات. 
وقد لا يكونون قد تلقوا أي شكل من التدريب قبل التعامل مع نظم استرجاع 
الإنترنت فعلا. يضاف إلى ذلك أنه قلما يكون هناك عادة وسيطء كما في حالة نظم 
الخط المباشرء ليقوم بإجراء عملية البحث للمستفيد. ويفرض غياب الوسيطء وافتقار 
معظم المستفيدين من نظم استرجاع الإنترنت إلى الخبرة» شرطا بالنسبة للحد من جهد 
المستفيد» أكثر صرامة ما يتعلق بأي بيئة أخرى لاسترجاع المعلومات. 

وفضلا عن معايير التقييم الخمسة التي سلف ذكرهاء ينبغي أيضا وضع 
استرجاع العبارات» والاسترجاع متعدد اللغات» والبحث عبر اللغات. في الحسبان» 
في تقييم نظم استرجاع الإنترنت. وقد شرحنا مفهوم استرجاع المقاطع أو الفقرات في 
0١‏ »: قبل مناقشة نظم استرجاع الإنترنت على وجه التحديد. ولما كانت 
العنكبوتية قد أصبحت أحد التطبيقات الجوهرية للإنترنت» وتتخذ وثائق العنكبوتية 
شكل الروابط الفائقة» قإنه يبدو من الضروري» على نحو متزايد» توافر مقومات 
استرجاع الفقرات أو المقاطع في الإنترنت؛ فالنهج التقليدي لاسترجاع الوثائق كاملة» 
لا يكفل مساعدة تذكر بالنسبة للمستفيد من نظم استرجاع الإنترنت. في تحديد 
المعلومات التي تدعو الحاجة إليها؛ ويرجع ذلك إلى حد ما إلى البنيان الفائق لوثائق 
العنكبوتية. فمن الممكن لمقطع أو فقرة المعلومات المرغوب فيه؛ أن يكون مطموراً في 
أعماق البنيان» كا أن الحجم غير العادي لبعض وثائق العنكبوتية» يعد مشكلة في حد 
ذاته. ولهذا السبب يبدو استرجاع الفقرات أو المقاطع خاصية مفضلة بالنسبة لنظم 
استرجاع الإنترنت. وفي عام /1181» بدأت سلسلة مؤتمرات استرجاع النصوص 
710 الشهيرة؛ مشروع بحث حول استرجاع الفقرات سمي مسار الرد على الأسثلة 
2515 0115)1011) (2000 روكعطا:001؟؟١).‏ 


46 


ويتعلق الاسترجاع متعدد اللغات»؛ أو البحث عبر اللغات» الذي نوقش في 
١4‏ بالبعد اللغوي لنظم استرجاع المعلومات. وكم| عولجت في الفصل التاسع» فإن 
المعلومات باللغات غير الإنجليزية؛ يتم تحميلهاء على نحو متزايد» على الإنترنت» بم 
يوحي بأن عامل اللغة في سبيله لأن يصبح متزايد الأهمية؛ بالنسبة لنظم استرجاع 
الإنترنت. وتتضمن أنواع أخرى من نظم استرجاع المعلومات؛ معلوؤمات متعددة 
اللغات: إلا أنها لا تقترب إلى مستوى يمكن مقارنته بمستوى نظم استرجاع 
الأنتردف ركاف التشدوة عب الناطتين والاتجليدية يمتلوة أكثر :لا بالئة مد 
إحمالى المتعاملين مع الإنترزنت» في يونيو عام ٠٠١١8‏ وصناءعاجة]8! كاله علص 
(2009 وناه:©). والعدد في ارتفاع مستمر. ويبدو من المعقول فقط إذن» إدخال 
البعد اللغوي في تقيبم نظم استرجاع الإنترنت. وقد تمت دراسة كل من الاسترجاع 
متعدد اللغات». والبحث عبر اللغات في مؤتمرات استرجاع النصوص )113 
(2000 ,11312819 عل 008655؟). وقد خص كلاف (2007) طاعد010) الجهود 
التي بذلت في منتدى كلف للصور "1.11) 1502886. وهو مسار لمنتدى التقييم عبر 
اللغات (1151©)) تصدده1 24155 تلد 7ت ع6ع038ع055-1385)): نشأ للتقييم واسع 
المدى لنظم استرجاع الصور عبر اللغات. وقد ورد وصف منتدى التقييم عبر اللغات 
0115 في 7/١/9‏ 

ويتصل كل من استرجاع المقاطع أو الفقرات [99ةتتاء ع8دوقوص 
والاسترجاع متعدد اللغات» والبحث عبر اللغاتء في الواقع» بمعيار تقييم مقومات 
البحث. إلا أن هذه السبل قد نوقشت بمعزل بعضها عن بعض. في هذه ا حالة؛ لتأكيد 
أهميتهاء وإبراز التغيرات التي طرأت على إطار التقييم الذي اقترحته تشو وروزنتال 
(1996) اقطاصء1#05 0سه تسطن) لنظم أستر. جاع الإنترنت. 
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وفي ذروة أنشطة التقييم بالنسبة لنظم استرجاع الإنترنت» أشار أوينهايم 
وآخرون (2000) .1ق اع ,تسأعطهعمم0,. إلى وجود قليل من الاطراد فيها بين 
الدراسات المتصلة» من حيث معايير أو طرق التقييم المتبعة. وقد أوصوا بتطوير 
مجموعة معيارية من الأدوات اللازمة لعمليات التقييم في المستقبل» كما قدموا أيضا 
بعض المقترحات المبدئية حول ما ينبغي أن تتضمنه هذه المجموعة المعيارية من 
الأدوات. ولما كانت نظم استرجاع الإنترنت» هي أسرع الأنواع نموا في أسرة نظم 
استرجاع اللونات: دان الأوان لتجديد جهودنا البحثية في تقييم هذه النظمء 
لدعم مسيرة تقدمها ونموها. 


معابير تقييم نظم الاسترجاع متعددة الوسائط: 

ناقشنا استرجاع المعلومات متعددة الوسائط في 4/ ؟» تحت العناوين الفرعية 
'استرجاع الصور الثابتة' وٌاسترجاع الأصوات» وٌاسترجاع الصور المتحركة . 
وتشهد جهود البحث والتطوير في هذا المجال توسعا سريعاء مسايرة لنضج التقنيات 
المتصلة به. ونتيجة لذلك أصبح الآن هناك عدد لا بأس به من نظم الاسترجاع 
الخاصة بالمعلومات متعددة الوسائط. في متناول المستفيدين. وقد لوحظت الحاجة إل 
تقييم مثل هذه النظم الخاصة بمعلومات الوسائط المتعددة» من جانب الباحثين في 
المجال. وفي التقرير الذي أعده ترانت (2004) 218846 تدل مسارات ترك 118880 
الخاصة باسترجاع الوثائق الناطقة 2221تاء120 «عكامم5) غ511 دكلء92 :110150 
(18»36931 والفيديو (الني سبقها عام ٠٠١”‏ تركفيد -”707 1110009103 
»ع /كاءء» ز0:م/5].507ثه.1أمله)؛ بالإضافة إلى مشروعات مثل إميجكلف 


"آكا1ن) عققم1 (11.08ء2881ص)؛ تدل جميعها على ضرورة تقييم استرجاع 
المعلومات متعددة الوسائط. 
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وعلى عكس تقييم استرجاع المعلومات النصية» الذي تراكمت محاولاته على 
مدى خمسين عاما من الجهد والخبرة (مثل تجارب كرانفيلد 245610ه") الرائدة) لا 
يبدو هناك سوى قليل من الباحثين الحريصين على محاولة تقييم استرجاع المعلومات 
متعددة الوسائط. ويفسر هذا العزوفء. إلى حد ماء لما بدأ مجلس موارد المكتبات 
والمعلومات 150111665 125140133801018 320 3ق نط آلآ ده لأعسنامن). وكذلك 
اتحاد المعلومات المتشابكة 0303801052كم1 0ععاتده؟اع11 :ه10 02113405). وكلاهما 
في الولايات المتحدة الأمريكية» مشروعا يهدف لتطوير خدمات مرصد بيانات 
استرشادي لاسترجاع الصور (2004 ,1820): والتجارب الفردية لاختبار نظم 
بعينها لاسترجاع المعلومات متعددة الوسائط مألوفة (راجع على سبيل المثال ,قصههط) 
38 و7113 عن 13535 ,1065612635 20025).؛ في الوقت الذي غالبا ما كانت 
تصمم فيه دراسات أخرىء لمقارنة التق القائم غل الاختوى لاستربجاع العلومات 
متعددة الوسائطء. مقابل النهج القائم على الوصف (راجع على سبيل المثال 1لاءم)ء2 
358 ,ل اتحة4 :) وما لا يزال غائبا في هذا المجال الخاص ببحوث التقييم»ء هو 
الإطار» أو مجموعة المعايير التي يمكن أن تطبق للحكم على جودة نظم استرجاع 
المعلومات متعددة الوسائط. فأداء الاسترجاع فقط. على سبيل المثال» هو الذي يقاس 
بمعايير تقليدية كالتحقيق والاستدعاء؛ حتى في مسار ترك الخاص بالفيديو 
عاءةها 171060 :118350 (2003 ,075 © «منأوءعم58). وماتلاه تركفيد 
710710 (2007 ,5منوعمم8). ولا يزال هناك بعض الجوانب الاأخرى لنظم 
استرجاع معلومات الوسائط المتعددة؛ التي لم تخضع للاختبار في جهود التقييم. 

وقد وض عالباحثون في اسستر جاع المعلومات الموسيقية (81114)) 
وهو قسم واضح لمعالم في استرجاع المعلومات متعددة الوسائط». منصتهم 
الخاصة بالتقييم» وذلك على غرار الإطار الأساس لمؤتمرات استرجاع النصوص 
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0 )111 (2003 ,عله 1207). وبناء على الوثائو ئق التي جمعها داو في 
(2004) عذه1820؛ فإن تقييم استرجاع المعلومات الموسيقية +311 لا يزال في المرحلة 
ا 0 
للموضوع. دون إجراء أي تقييم فعلي. وبعبارة أخرى, لا تزال هناك حاجة لعمل 
الكثير لسد فراغ تقييم استرجاع المعلومات الموسيقية على وجه الخصوص. وتقييم 
استرجاع المعلومات متعددة الوسائط بوجه عام. 


القابلية للإفادة معيارا للتقييم: 

القابلية للإفادة 'إغ1[1 11583 مصطلح تم سكه منذ عهد قريب نسبياء ليحل محل 
عبارة التعاطف مع المستفيد و5ع0110صء3:-ءدت. التي جرت العادة على أن تكون 
الكلمة المفتاحية» التي عادة ما نجدها في سياق تفاعل الإنسان مع الحاسب 9ع1؟001) 
(2008 ,118:13 عي. على الرغم من إمكان تتبع جذوره في قانون مورز 78100655 
117 لنظم استرجاع المعلومات» الذي اقترح عام ١157٠‏ (راجع "/7/١/١‏ في هذا 
الكتاب). ووفقاللمنظمة الدولية للتوحيد القيامبى [21088متء151 
(1998 ,1500) 021012210 سماد ده سمه عتصدع 02 فإن القابلية للإفادة تعرف 
بوصفها” المدى الذي يمكن به الإفادة من منتج ماء من جانب مستفيدين محددين» 
لتحقيق أهداف محددة» بفاعلية» وكفاءة» وقناعة أو ارتياح» في سياق معين للإفادة . 

وتوضح هذه المواصفة المعيارية الخاصة بالأيزو 2150 كيف يمكن التحقق من 
المعلومات اللازمة لأن توضع في الحسبان» عند التحقق من القابلية للإفادة أو تقييمهاء 
من حيث أداء المنتج ورضاء المستفيد (2001 ,88 0867). ومن ناحية أخرىء يقدم 
جاكوب نيلسن 11161568 13105» الذي حقق إسهامات مهمة لنشر القابلية للؤإفادة 
كنهج بديل لتقييم مواقع العنكبوتية - يقدم تعريفا بسيطاً للقابلية للإفادة:”القابلية 
للإفادة ... إنما هي في الأساس قضية ما إذا كان النظام صا حا ب| فيه الكفاية لتلبية جميع 
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المستفيدين والمديرين (24 .5 ,1993). 
وما لاشك فيه أن كلا من تعريف الأيزو 150 وتعريف نيلسن ينطويان على 
معانٍ أكثر اتساعاء بين| تدل القابلية للإفاذة» في مجال تنظيم المعلومات واسترجاعهاء 
في الأساسء على تقييم أداء نظم استرجاع المعلومات ورضاء المستفيد. وعلى هذا 
النحوء فإن القابلية للإفادة ليست مقياسا واحدًا لتقييم نظم استرجاع المعلوماتء وإنا 
تشمل مجموعة من المعايير الخاصة بأهداف التقييم. ويقترح نيلسن ,1993) دعداءةة 
(2003 الخصائص الخمس التالية للقابلية للإفادة الجيدة: 
القابلية للتعلم: ما مدى السهولة بالنسبة للمستفيدين» في إنجاز المهام 
الأمناس» التي يواجهونها ف النظام لأول مرة؟ 
» الكفاءة: بمجرد أن يلم المستفيدون بالنظام» ما هدى السرعة التى يمكن 
بها إنجاز المهام؟ 
٠.‏ القابلية للتذكر: عندما يرجع ا لمستفيدون إلى النظام» بعد فترة من التوقف 
عن الإفادة منه» ما مدى السهولة التي يمكنهم مها استعادة الكفاءة؟ 
« الأخطاء: كم عدد الأخطاء التي يرتكبها المستفيدون» وما مدى جسامة 
هذه الأخطاءء وما مدى السهولة التى يمكن بها للمستفيدين التوقف عن 
ارتكاب الأخطاء؟ 
٠‏ الرضاء: ما مدى المتعة في الإفادة من النظام؟ 
وتردد هذه العناصر الخمسة بوضوح. صدى النقاط الخمس التي نوقشت في 
”ف هذا الكتاب. ومن ناحية أخرىء يميل شنايدرمان وبليزانت 
(2005) هتقاط قصة سقددء لع ص5 للنظر إلى مصطلح القابلية للإفادة 
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'1103ؤ52ونا بوصفه مرادفا للتصميم الجيد لواجهة التعامل 5]266)م1 8000 
53 وذلك في الطبعة الرابعة من الكتاب الكلاسيكي" تصميم واجهة المستفيد؛ 
استراتيجيات للتفاعل الفغال بين الإنسان والحاسب “عونا 46 عستمعنوءا' 
0111211161)-1113111313 ع كتاعء 111 «ز1"0 جعلعء21ا5 :ع2 ]نعلم1. 
وقد استخدمت القابلية للإفادة» بصرف النظر عن طريقة تفسير دلالاتها» على نطاق 
واسع» كطريقة لتقييم جودة مختلف نظم امسترجاع المعلومات؛ فقد تم على سبيل 
المثال» إجراء اختبار للقابلية للإفادة» على الفهارس المتاحة على الخط المباشر حديثة 
التطبيق (ر اجع على سبيل المثال 511118) :2006 رعع29 عق 1306218 طم 
7 53:86 يق )» والأنواع الأخرى من نظم استرجاع المعلومات. وفضلا عن 
ذلك» تم اختبار إحدى واجهات البحث (فلامنكو 1'1880268©0) من جانب هيرست 
وآخرين (2002) .21 اء ,أستهعلل, ى]) اختبر هاجا وكانيدا 1288608 0ضه 11383 
(2005) نظاما لاسترجاع الفيديوء من وجهة نظر القابلية للإفادة. وقد أنشئت عدة 
مختبرات للقابلية للإفادة» منذ نباية العقد الأخير من القرن العشرين.ء بتجهيزات 
مصممة خصوصًاء وبرمجيات وضعت في فضاء فيزيائي» صممت خصوصًا لذلك 
المدف» حتى وإن كان ما تختبره هذه المختبرات بوجه عامء يتجاوز حدود القابلية 
للإفادة الخاصة بنظم استرجاع المعلومات. 


مشروعات التقييم الكبرى لتنظيم المعلومات واسترجاعها: 

مضى حوالي نصف قرنء مَنذ إجراء أول دراسة تقييم في استرجاع المعلومات 
عام ١9147‏ (1979 ولع أققعطقر]). وقد تم تنفيذ مشروعات عدة» لتقييم تنظيم 
المعلومات واسترجاعهاء منذ ذلك الحين. وتجارب كرانفيلد (راجع على سبيل المثشال 
52 ,0169600 ): ومشروع المدلرز 115:21:4185 (نظام تحليل واسترجاع 


032 


الإنتاج أ لفكر يِ الطبي 1171221 له 41 11112111 111101221 
تدع اولز5) (راجع على سبيل المثال 1968 ,تاعاققعهه.1)؛ وتجربة سمارت '51/141341. 
نظام معالحة واسترجاع النصو ص 040 2002 الامتمةط11 عطا 10 معاووة) 
(كاعء 1 01 116921 زر اجع على سبيل المثال 1981 ,5814013)): ودراسة ستيرز 
5" (سمعاوزة لهاعتماء 1 لصه عع5]0:2) (راجع على سبيل المثال عن عتهاظ 
5 ,1/13107): وسلسلة مؤتمرات استرجاع النصوص 114150 (راجع على سبيل 
المثال 2006 رووء7005؟ #6 مقصة]1 :1993 ,33م:113). نضلا عن بعض 
المشروعات الكبرى في هذه الفئة. ومن بين جميع دراسات التقييم الكبرى»؛ سوف 
نتناول تجارب كرانفيلد» وسلسلة مؤتمرات استرجاع النصوص ©1188 بالتفصيل؛ 
نظرا لأنهم| الأقوى تأثيرا في تاريخ تقييم تنظيم المعلومات واسترجاعها. كما نناقش 
أيضا المشكلات والقضايا المحيطة بمشروعات تقييم تنظيم المعلومات واسترجاعها. 
تجارب كرانفيلد: 

أجريت تجارب كرانفيلد على مرحلتين» هما كرانفيلد الأولى» وكرانفيلد الثانية» 
بين عامي ١4651‏ و214717 وهما أول مشروعات التقييم المستفيضة: تتم تنفيذهها 
بقيادة سيريل دبليو. كلفردون 16761008) .777.)؛ الذي كان حينئكذ اختصاصيا 
للمكتبات بكلية علوم الطيران بكرانفيلد في انجلتر | هذ عتاتتقصممع4 آأه ععع011©) 
ةاعم ,4اءتقصه0. وعلى الرغم من أن تجارب كرانفيلد كانت تتعلق بتقييم 
الطرق اليدوية لتنظيم المعلومات واسترجاعهاء فإن المنهج الذي ابتكر في المشروع؛ قد 
استخدم في بعد لتقييم الكثير من الطرق الرقمية لتنظيم المعلومات واسترجاعها. 
وغالبا ما تسمى الدراسات المشايهة لتجارب كرانفيلد بالمشروعات المائلة لكرانفيلد. 
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كرانفيلد الأولى: 

صممت تجارب كرانفيلد الأولى لاختبار الكفاءة النسبية لأربعة نظم 
للتكشيف. في أداء الاسترجاع. في بيئة تنطوي على الكشير من المتغيرات الأخرى» 
كالمكشف. والوثيقة» واستفسار البحث. وقد استخدم الاستدعاء والتحقيق لقياس 
أداء الاسترجاع في هذا المشروع؛ كأول تطبيق من هذا النوع» في تجارب واسعة النطاق 
لتقييم تنظيم المعلومات واسترجاعها. يضاف إلى ذلك أنه كان من الممكن حساب 
الاستدعاء في كرانفيلد؛ نظرا لأن مجموعات الاختبار التي تكونت خصوصًا 
للمشروع كانت تحصورة ومعروفة. وكانت نظم التكشيف الأربعة التي وقع عليها 
الاختيار لكرانفيلد الأولى هي: 

.)0260( التصنيف العشري العالمي‎ ٠ 


« فهرس موضوعي هجائي. 

ه حطة د تصنيف وجهي. 

» نظام المصطلح الواحد للتكشيف الترابطي ©600701081. 
الخبرات والتآلف مع النظم التي يتم اختبارها؛ فقد كان لدى أحدهم معرفة 
موضوعية» ولدى الآخر خبرة بالتكشيف, بينها أتى الثالك! من إحدى المكتبات 
العامة مباشرة» ولم يكن لديه معرفة موضوعية أو خبرة في التكشيف. وقد تم الحصول 


(*) قد لا يعلم البعض أن هذا الثالث هو فردرك ولفرو لاتكستر, الذي أصبح علي يشار إليه 
بالبنان» في مجال استرجاع المعلومات. (المترجم) 
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على مئة وثيقة» موزعة بالتساوي» على المجال العام لعلوم الطيران» والمجال 
التخصص وهو الديناميكا الهوائية عالية السرعة. وطلب من كل مكشف تكشيف كل 
من الوثائق المئة حس مرات» وذلك بإنفاق دقيقتين» وأربع دقائق» وثاني دقائق» 
واثنتي عشرة دقيقة» وستة عشر دقيقة» في تكشيف الوثيقة. وكان متوسط عدد 
المداخل الكشفية التي تخصص لكل وثيقة» يتراوح ما بين اثنين وعشرة ,ه0169©00) 
(1962. وكانت استفسارات البحث الخاصة بالاختبار”مصنعة إذ يقوم أعضاء من 
خارج المشروع» بفحص كل وثيقة» ثم صياغة الاستفسارات التي يمكن أن تكون . 
هناك وثيقة معينة صا حة بالنسية لمها؛ فنشأ ما مجموعه :٠٠‏ استفسار للبحث» 
استخدمت في ثلاث دورات لعمليات البحثء لتشكل )7*54:0(1١٠٠١‏ استفسارا. 

وكانت عمليات البحث تتم بواسطة العاملين بالمشروع في المقام الأول. وقد 
أجريت دورة البحث الأولى على المجموعة الأولى المكونة من 5٠٠‏ استفساراء كاختبار 
قبل أ5عام. أما دورة البحث الثانية فكانت مصممة للتغلب على المشكلتين اللتين 
تمت مواجهتهما في الاختبار القبل» وذلك باستخدام المجموعة الثانية المكونة من 4٠٠١‏ 
استفساراء المشتقة من 5*٠‏ سؤالا. وكانت المشكلة الأولى هي إلى أي مدى كان من 
يقوم بإجراء عملية البحث مقتنغا بمواصلة البحث بينم| كان من المعروف أن الوثيقة 
الصالحة كانت في مكان ما بالملف؟ والثانية هي كيف يمكن لمن يقوم بإجراء عملية 
البحثء أن يقرر على وجه التحديدء ما كان يشكل استراتيجية ببحث مختلفة» عند 
استعمال مصطلحات بعينها من لغات التكشيف الأربع؟ ثم تم بعد ذلك تحديد نقطة 
توقف بالنسبة لعملية البحث. في الدورة الثانية» وتطلب الأمر إدخال تعديلات على 
استراتيجيات البحث بالنسبة للاستفسارات نفسهاء لتكون هذه الاستراتيجيات 
عامة» ويمصطلحات كل نظام من نظم التكشيفء وذلك على نحو محايد قدر 
الإمكان. وقد كشف تحليل إخفاق النتائج بالنسبة للجولة الثانية» عن حالات نجح 
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البحث فيها في أحد نظم التكشيفء إلا أن الاستفسار نفسه في نظام آخر أخفق نظرا 
لصياغة الاستراتيجية. ومن ثم؛ صممت دورة ثالثة للبحث باستعمال مجموعة أخرى 
من 5٠٠‏ استفساراء للتخلص من مظاهر التباين بين من يقومون بإجراء عمليات 
البحث واستراتيجيات البحث؛ وذلك باتباع استراتيجية معيارية ثابتة لكل 
النظم الأربعة. 
نتائج الاختبار: 

كانت أهم نتيجة انتهت إليها كرانفيلد الأولى» هي أن نظام المصطلح الوا 
حقق أفضل استدعاءء من بين نظم التكشيف الأربعة المختلفة» التي شملها الاختبار 
(راجع الجدول رقم ١/١ ١‏ على الرغم من أن جميع النظم حققت مستوى مماثلا في 
كفاءة الأداء (1962 ردمقمء61649©). 


الجدول رقم /١١‏ 7 معدل استدعاء نظم التكشيف الأربعة 


التصنيف العشري العالمي 





خطة التصنيف الوجهى 


كذلك كشفت كرانفيلد الأولى عن أن تزايد الوقت المستنفد في التكشيفء أدى 

إلى تزايد الاستدعاء حتى مستوى معين» بعده يمكن للارتباط الإيجابي بين وقت 

التكشيف والاستدعاءء» أن يصبح عكسياء كما يتبين في الجدول رقم 7/١١‏ 
(1962 رمملم0169). 
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الحدول رة قم ”/١١‏ زمن التكشيف في مقابل معدل الاستدعاء 


زمن التكشيف (بالدقيقة قة) الاستدعاء (/7) 





وبينما كان المكشفون الثلاثة» مختلفين من حيث خيرة التكشيف والمعرفة 
الموضوعية. فإنه لم يلاحظ اختلاف يذكر في| بينهم» في استرجاعهم للوثائق التي 
كشفوها بأنفسهمء أو في أدائهم في التكشيف. وفضلا عن ذلك فإن معدلات النجاح 
في استرجاع الوثائق حول المجال العام لعلوم الطيران» لوحظ أنها أفضل بنسبة ؛ بالمئة 
للديناميكا ا هوائية عالية السرعة. وتشمل النتائج الأخرى التي أسفرت عنها كرانفيلد 
الأولى ما يلى: 

» هناك علاقة تناسب عكسى بين الاستدعاء والتحقيق. 

« من الممكن تحقيق زيادة مقدارها واحد بالمئة في التحقيق على حساب فقد ” 

٠‏ كانت النظم تعمل بمعدل استدعاء ما بين /٠١‏ بالمئة و30 بالمئة» ومعدل 

تحقيق ما بين 8 بالمئة و١‏ ؟ بالمئة. 
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ومن بين جميع النتائج التي لخصناها هناء هناك ثلاث تتجاوز التوقعات» ورب] 
تتناقض مع بعض الاعتقادات العامة السائدة في أوساط تنظيم المعلومات 
واسترجاعها. وأولى هذه النتائج الثلاث. فيم| يتعلق بالاستدعاء» أن نظام المصطلح 
الواحد فاق في أدائه ثلاثة نظم للغات المقيدة شملها المشروع؛ على الرغم من الاعتقاد 
النظري بأن اللغة المقيدة تسفر عن أداء استرجاع أفضل من غيرها. وقد أدت هذه 
النتيجة بشكل غير مباشرء إلى الحث على البحث حول التكشيف الآلي» الذي يعتمد 
بقوة على المصطلحات الأحادية أو الكلمات المفتاحية. وثانيهاء تبين أن أداء نظام 
التكشيف بالنسبة للاسترجاع, لا يتوقف على خيرة المكشف أو المعرفة الموضوعية» 
بين| كان الاعتقاد السائد على العكس تماما؛ أى إنه من الممكن لخبرة المكشف ومعرفته 
الموضوعية» أن يساعدا على تحسين الأداء. وثالثهاء تبين من كرانفيلد الأولى أن الزيادة 
في زمن التكشيف. لا يمكن بالضرورة أن تؤدي إلى زيادة الاستدعاء. وعلى العكسء» 
كان هناك تناقص في الاستدعاء عندما ارتفع زمن التكشيف من أربع دقائق إلى ثماني 
دقائق (راجع الجدول رقم /١١‏ ”"). وبين| ارتفع معدل الاستدعاء ثانية» نتيجة لزيادة 
زمن التكشيف. فإن العائد في أداء الاسترجاع لا يبدو متناسبا مع الوقت المستنفد في 
التكشيف؛ فقد ارتفع معدل الاستدعاء» على سبيل المثال» بمقدار ؛ بالمئة فقط (أي من 
بالمئة إلى "84.7 بالمئة)» بينا تضاعف الوقت المستنفد في التكشيف أربع مرات 
(أي من أربع دقائق إلى ست عشرة دقيقة). 
كرا نفيلد الثانية: 

لقد صممت تجارب كرانفيلد الثانية لتقييم تأثير مختلف أدوات التكشيف على 
أداء الاسترجاع. وأدوات التكشيف هي التدابير التي يتخذها المكشف للارتفاع 
بمستوى الاستدعاء أو التحقيق. وتشمل أمثلة أدوات التكشيف المترادفات» وعلاقة 
العام بالخاص 20085اع" علتتعدصعق والريط طه03021ممء. والروابط وكلسلكء 
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والأدوار 50165. وقد وردت المعلومات حول التجارب في تقرير كلفردون عن 
المشر وع (1962 رصملعء:016)): 
لقد انطلقتا من الاعتقاد بأن جميع لغات التكشيف مزيج 
من فئات مختلفة من الأدوات. وتنقسم مشل هذه الأدوات إلى 
فئتين؛ تلك الأدوات التي يقصد بها تحسين معدل الاستتدعاء» 
وتلك التي يقصد بها تحسين معدل التحقيق... وكان هدف 
التجربة دراسة ما يمكن أن يكون لكل من هذه الأدوات» 
منفردة أو في أي تجمع محتملء من أثر على الاستدعاء 
والتحقيق. (5.17) 
تصميم التجربة: 
تم تجميع نحو مئتي بحثء بكل بحث بوجه عام؛ ما بين خمسة إلى عشرة 
مراجع. ثم طلب بعد ذلك من كل مؤلف أن يبين» في شكل تساؤل بحث,. المشكلة 
الرئيسة التي كانت سببا لدراسته. على افتراض أن البحوث قد كتبت نتيجة 
لدراسات أجريت لتقديم إجابات لتساؤل ماء أو عدة تساؤلات في ذهن المؤلف. 
كذلك طلب من كل مؤلف أن يصوغ في حدود ثلاثة تساؤلات إضافية» تعبر عن أي 
قضايا فرعية أثيرت أثناء إعداد الدراسة. وبعد ذلك تم الحصول على مستخلصات 
لمراجع هذه البحوث (أي الوثائق المستشهد بباء إلى جانب بعض البحوث غير 
المستشهد بهاء التي تم التحقق منها من جانب طلبة الدراسات العليا بالكلية» بناء على 
العناوين» أو عن طريق المزاوجة الوراقية عمتادنامء لهعءتطمهمومناطئط (إذ تتزاوج 
وثيقتان وراقيا عندما تشتمل قوائم مراجعه على وثيقة واحدة مشتركة أو أكثر). وقد 
طلب من المؤلفين الكشف عن صلاحية المراجع والبحوث غير المستشهد بهاء بالنسبة 
لكل تساؤل؛ على مدرج من واحد إلى خمسة» حيث يدل الواحد على الأكثر صلاحية 
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على الإطلاق» وذلك على افتراض أن المراجع قد سجلت لأنها ينبغي أن تكون متصلة 
على نحو ماء بموضوع البحث (1963 ,111115 ع 01676002)). وقد تحقق المؤلفون 
من ١471‏ وثيقة مستشهد بهاء صا حة كليا أو جزئيا للأسئلة التبي طرحوهاء البالغ 
عددها 114 سؤالاء وقد تم اختيار ١4٠١‏ وثيقة و١711‏ سؤالا من هذه المجموعة؛ في 
النهاية لكرانفيلد الثانية. 


وكانت المجموعة التجريبية المكونة من ١5٠١‏ وثيقة» في المقام الأول في مجال 
الديناميكا الهوائية عالية السرعة وتصميم الطائرات. وقد ”كشفت كل وثيقة بثلاث, 
طرق؛ تم في الأولى اختيار أهم المفاهيم وتسجيلها باللغة الطبيعية للوثيقة» وفي الثانية 
تم تسجيل المصطلحات التي وردت في كل من المفاهيم التي وقع عليها الاختيار» وفي 
الثالثة تم الجمع بين المفاهيم بطرق مختلفة؛ لتشكل الموضوعات الرئيسة للوثائق. 
كذلك أعطي لكل مصطلح وزن (أي واحد أو اثنان أو ثلاثة» حيث واحد هو الأكثر 
أهمية على الإطلاق) وذلك في أثناء عملية التكشيف. للدلالة على أهميته النسبية. وقد 
استخدمت أدوات تكشيف مختلفة أيضا أثناء عملية التكشيف, من أجل استكشاف 
مالها من تأثير على أداء الاسترجاع. 

وقدتمت عمليات البحث باستخدام مختلف أدوات التكشيف المطبقة 
في ثلاثة أنواع رئيسة للغات التكشيف. وهي لغات تكشيف المصطلح الأحادي؛ 
والمفهوم المفرد» والمصطلح المقيد أو المقنن. وقد وردت المواصفات الخاصة بلغات 
التكشيف هذه. تفصيلا في الشكل رقم (7) والشكل رقم (5) في مقالة كلفردون 
(1967) 01696002). كذلك تم اختبار لغات التكشيف المكونة من الكليات 
المفتاحية الواردة بالعناوين والمستخلصات. أيضا في المشروع. وكانت الاستفسارات 
تحلل إلى مصطلحات مفردة» وكانت عملية البحث تتم أولا للبحث عن مضاهاة 
بالنسبة لكل المصطلحات. وكانت المضاهاة تتم بعد ذلك على مستويات مختلفة» 
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وذلك باستبعاد أحد مصطلحات الاستفسار في كل مرة» وبالنسبة لكل ترابط محتمل 
بالمصطلحات المتبقية؛ فبالنسبة لاستفسار به خمسة مصطلحات مفردة على سبيل المثال» 
كانت عملية البحث الأولى تتم بكل المصطلحات الخمسة مجتمعة. وكان من الممكن 
إجراء عملية البحث الثانية بأي من المصطلحات الأربعة من الخمسة؛ باستبعاد 
مقطاع واخد ين الاتشمار. ويد ولف تتسعملة البح بائ مين التمطلعات 
الثلاثة» ثم بأي من المصطلحين. إلى أن يصبح هناك مصطلح واحد للمضاهاة. وكان 
من الممكن استعمال المترادفات؛ والمصطلحات الأضيق والمصطلحات الأوسعء 
والمقومات الأخرى, لتحل محل الكلمات الأصلية. وكانت عمليات البحث تتم على 
نحو يكفل المحافظة على - جميع العوامل ثابتة» فيا عدا عامل واحد متغير. وفي المنال 
السابق» كان عدد المصطلحات الواردة في الاستفسار هو العامل الوحيد المسموح 
بتغيره» بين| كانت تتم المحافظة على جميع العوامل الأخرى ثابتة. وكانت كل من 
التسديدات كاقطء والشوشرة 5م020 عكلو أي الوثائق غير الصالحة المسترجعة. يتم 
تسجيلها بالنسبة لكل عملية بحثء بحيث يمكن حساب معدلات الاستدعاء 
والتحقيق. 

وكان التصميم برمته لافتا للنظر نظرا لحجمه. وتنوعه؛ وتعقده. ولم يكن 
الاختبار على أي حالٍ سهل» وخصوصا إذا علمنا أنه قد تم إجراؤه يدويا. 


نتائج التجربة: 

لقدتم حساب متوسط معدلات الاستدعاء والتحقيق الخاصة بجميع عمليات 
البحث. في كل لغة من اللغات» واستخدم هذا المتوسط لقياس تأثير أدوات التكشيف 
على أداء الاسترجاع في كرانفيلد الثانية. وقد سجلت التجربة النتائج التالية: 
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كانت لغات التكشيف المعتمدة على المصطلحات المفردة» متفوقة من 
حنة الأدا على أي نوع آخر. 
»ع عندما استخدمت المصطلحات المفردة للتكشيف. أدى إدخال الفقئات 
المقابلة» وخصوصا أشباه المترادفات. إلى انخفاض مستوى الأداء. 
عندما استخدمت المفاهيم للتكشيفء تراجع مستوى الأداء؛ بإدخال الفئات 
الرئيسة والفرعية والمناظرة؛ إلى جانب المفاهيم الأصلية. 
عندما استخدمت المصطلحات المقيدة للتكشيفء أدى إدخال المصطلخات 
الأضيق.والمصطلحات الأوسع. إلى تراجع مستوى الأداء. ١‏ 
كان أداء لغات التكشيفه المشكلة من العناوين» أفضل من أداء تلك 
المشكلة من المستخلصات. 
وكان ما يدعو للعجب فعلاء ولا يمكن تفسيره ببساطة» أنه كما تبين في 
كرانفيلد الثانية» أن أفضل لغات التكشيف أداء. كانت تتكون من كلمات مفردة غير 
مقيدة؛ منتقاة من الوثائق. ولم يكن بإمكان المشاركين في البحث. التوصل إلى 
تفسيرات حو ل هذه المفاجأة (1966 رصععخ] عت 111115 ,هه016900)). وتتطابق هذه 
النتيجة أيضاً مع إحدى نتائج كرانفيلد الأولى» وهي أن نظام المصطلح الواحد 
تمعانسه قد تفوق, في أدائه على نظم اللغات المقيدة الثلاثة الأخرىء التي شملها 
المشروع» من حيث الاستدعاء. وبناء على كرانفيلد الثانية» فإنه يبدو أن المصطلحات 
الأصلية تؤدي دائاء على نحو أفضل وحدهاء دون أي تنويعات إضافية 
(كالمصطلحات الأوسع والمصطلحات الأضيق على سبيل المثال). كذلك قدمت 
لغات التكشيف المعتمدة على العناوين» أداء أفضل من أداء اللغات المعتمدة على 
المستخلصات؛ نظرا لأن العناوين بوجه عام؛ أكثر دلالة ودقة من المستخلصات. 
كذلك تأكدت أيضا علاقة التناسب العكسى بين الاستدعاء والتحقيقء في كرانفيلد 
الثانية» عندما أصبحت أدوات التكشيف جزم من البيئة التجريبية. 
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مشكلات تجارب كرانفيلد: 

نشر عدد كبير من المراجعات والانتقادات (راجع على سبيل المثال 19715 ,تعاعهة1 
7 ,1966 بلإتععكء1؟ :1971 ,1965 .2.14 وتامكتتة:5) منذ أجريت تجارب 
كرانفيلد» تشير إلى مختلف المشكلات التي اكتنفت هذه التجارب. وقد صنفت هارتر 
وهيرت (1997) 116:4 نصة 111161 هذه المشكلات في أربع فئات: الصلاحية وإمكان 
الاعتاد أو التعويل #اتلأطقناء قصه نوانةثلة والقابلية للتعميم 'واتلاطهطلهوعمعع, 
و الفائدة أو الجدوى 5وعصلدقعوت والقضايا النظرية 065ووا لقنطم6م060. ونظراً لأن 
القضايا النظرية أو المفاهيمية (مشل كيف يمكن تعريف وقياس مفاهيم كالصلاحية 
والرضاء) موجودة في كل مشروعات تقبيم تنظيم المعلومات واسترجاعها؛ فإن المناقشة 
التالية سوف تدور فقط حول ثلاث فتات من المشكلات» المدصلة على وجه التحديد 
بتجارب كرانفيلد» وهي الصلاحية وإمكان الاعتاد عليهاء والقابلية للتعميم» 
والقابلية للتطبيق. 

ولقد كانت صلاحية التجارب وقابليتها للاعتماد عليهاء موضوعا للتساؤل 
نظرا لعدة حجج؛ فمن الممكن. على سبيل المثال» للوثائق التي قدمت فعلا للمؤلفين 
الذين طرحوا الأسئلة» لتقييم الصلاحية في) يتعلق بالأسئلة المقابلة» أن تكون في 
صالح أساليب مضاهاة المصطلحات البسيطة» على حساب بعض نظم المضاهاة 
المركبة. كم لم تدخل أعداد كبيرة من الوثائق» التي كان من المحتمل أن تكون صا حة 
ولكنها لم تسترجع. في التقييم على الإطلاق. إلا أن النظام لم يحكم عليه سلبا؛ نظرا 
لعدم استرجاع هذه الوثائق. وكانت هناك أيضا افتراضات ليس لها مايبررهاء أولم 
تخضع للاختبار في التجارب؛ فعلى المرء على سبيل المثال» أن يفترض أن تكون أحكام 
الصلاحية التى صدرت على عدد من الوثائق» بالنسبة لسؤال معين» مناقضة لبعضها 
البعض. يضاف إلى ذلك أن الارتباط بين الوثائق الأصلية والأسئلة» في كرانفيلد 
الثانية» كان أقوى بكثير ما هو عليه في كرانفيلد الأولى. ويؤثر كل ذلك سلباً في 
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صلاحية تجارب كرانفيلد» وإمكان التعويل عليها؛ أي ما إذا كانت التجارب قد 
قاست فعلاً» ما كان قد قصد ببا قياسه» وما إذا كانت التجارب قابلة للتكرارء إذا ما 
اتبعت الإجراءات نفسها. 

وتبدو نتائج كرانفيلد غير قابلة للتعميم؛ لأنه لم تستخدم العينة العشوائية في 
التجارب. وفضلا عن ذلك» كانت المجموعات التجريبية صغيرة (أي مئة وثيقة في 
الأولى و٠٠4١‏ وثيقة في الثانية) بالمقارنة بالعدد الفعلي للوثائق في نظام ما لاختزان 
المعلومات واسترجاعها. وتبدو بعض النتائج» كما سبق أن بيناء مناقضة للاعتقاد 
العام والخبرة المكتسبة في أوساط تنظيم المعلومات واسترجاعها. وتقف كل هذه 
الحقائق وراء المخاوف بشأن قابلية هذه التجارب للتعميم. 

كذلك تبدو قابلية التجارب للتطبيق في النظم العاملة» موضوع تساؤلء نظرا 
للاصطناعية البادية في عدة أوجه لتجارب كرانفيلد؛ أوها أنه لى تكن هناك مشاركة 
حقيقية للمستفيدين في جميع مراحل التجارب. ثانياء كانت أسئلة البحث مصنعة؛ ولم 
تكن موجهة من جانب مستفيدين حقيقيين. ثالثاء لم يكن نظام الاختبار نظاما عاملاء 
وإنما صمم لمجرد إجراء التجارب. وما لاشك فيههء أنه من المستحيل التحكم في 
متغيرات الاختبار (كعدد المصطلحات التي ترد في الاستفسار والوقت المستنفد في 
استرجاع الوثائق؛ على سبيل المثال) التي ينطوي عليها الموقف في نظام عامل فعلا؛ 
ومن ثمء فإن ما تم التوصل إليه في بيئة تجارب كرانفيلد الاصطناعية» قد لا يكون 
قابلا للتطبيق على النظم العاملة لاختزان المعلومات واسترجاعها. 
أهمية تجارب كرانفيلد: 

على الرغم من كل ما وجه من انتقادات؛ فقد أحدثت تجارب كرانفيلد تأثيرا 
ضخا في كثير من مشروعات التقييم الأخرىء على نحو ما يل من أوجه؛ أولا تحققت 
تجارب كرانفيلد من العوامل الرئيسة التي تؤثر في أداء نظم الاسترجاع. ولغنات 
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التكشيف وأدوات التكشيف مجرد أمثلة لهذه العوامل. ثانيا طورت تجارب كرانفيلد» 
لأول مرة منهجا لا يزال متبعاً في مؤتمرات استرجاع النصوص ©11219» على الرغم 
من عيوبه الكثيرة. ثالثا أثرت تجارب كرانفيلد بوضوح. في نظرتنا بنظم استرجاع 
المعلومات. وكيف ينبغي دراستهاء للا فيه الصالح العام على الوطلاق 7 تقريبا عء5:ةم5) 
(1981 ,10265. رابعاء مهدت تجارب كرانفيلد الطريق نحو أساليب التكشيف الآلي 
الفعالة القابلة للتحقيق؛ نظرا لأنها أثبتت أن نظم المصطلح الواحد واللغة الطبيعية؛ 
تميل لأن يكون أداؤها مماثلاء إن م يكن أفضل من أداء نظم اللغات المقيدة. 

ولا يمكن المبالغة في أهمية تجارب كرانفيلد» حتى وإن بدت مشكلاتها لا 
يستهان بها. وفيم| يتعلق بتقييم نظم اختزان المعلومات واسترجاعهاء فإن جميع 
المشروعات الكبرى»:ب) في ذلك سلسلة مؤتمرات استرجاع النصوص :)2.2118 تبدو 
متأثرة بطريقة أو أخرى بتجارب كرانفيلد. ولا يمكن لمشروع تقييم واسع المدى 
بعينه» أن يصبح استثناء» في محال تنظيم المعلومات واسترجاعها. وذلك بعينه هو 
السبب وراء سك مصطلح”المشروعات على غرار كرانفيلد عاذا-14ءقصهع) 


ماءء زودم 7" 


(*) مما لا شك فيه أن دراسات كرانفيلد قد أرست أسس المنهج التجريبي في مجال علم المعلومات. 
مجلة المكتبات والمعلومات العربية» مج١ءع؛‏ أكتوبر .١44١‏ ص ص 40-49. وأعيد نشر 
هذه المقالة في: 
حشمت قاسم: دراسات فى علم المعلومات» ط؟. القاهرة» دار غريب, 1965. ص ص 
١154-0.(المترجم)‏ 
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سلسلة مؤتمرات استرجاع النصوص: 

تشكل سلسلة مؤتمرات استرجاع النصوص 565165 133000» استمرارا 
لمؤتمرات كانت تعقد في الولايات المتحدة الأمريكية سنوياء منذ عام ١597‏ (أي 
ترك ١-‏ 11810-1). بقصد تحقيق الأهداف التالية: 

٠‏ تشجيع البحث في استرجاع النصوص.ء اعتمادا على مجموعات ضخمة من 
البيانات النصية. 

« دعم التواصل بين القطاع التطبيقيء والأوساط الأكاديمية» والحكومية؛ 
بتوفير منتدى منفتح لتبادل أفكار البحوث. 

٠.‏ زيادة سرعة نقل التقنيات من مختيرات البحث إلى المتتجات التجارية» 
باستعراض التحسينئات الجوهرية في تقنيات الاسترجاع المتعلقة 
بمشكلات الواقع. 

© التوسع في إتاحة أساليب التقييم الملائمة للاستخدام من جانب القطاع 
التطبيقي» والأوساط الأكاديمية» ب في ذلك تطوير أساليب التقييم الجديدة» 
القابلة أكثر من غيرها للتطبيق على النظم ال حالية. 

وكانت هذه المؤتمرات تحظى بالرعاية المشتركة سين المعهد الوطنى للمواصفات 

المعيارية والتقنيات (نست 01087ططاعع1' 220 0105 تتماك 01 عامطنتاكصط أهده شدلا 
1151) وجهاز مشروعات بحوث الدفع المتطورة 0ععمة؟ل4 عفمعاء12 
كاعء ز2<00 للعتتهعوعخ1(داريا 1041124) (عمعع ىل رو الأجهز ةوالمئؤسسات الأخر 30 
ذات العلاقة (مثل أنشطة البحوث لمتطورة والبحوث والتطوير 40788660 
أمعطدمواء1269 لصة طعءمهعدء1 (أردا 41824) 17 لاعف وديوان وزارة الدفاع 
عكدء1ء10 01 أسعدصسأنردمء12) في الولايات المتحدة الأمريكية. 
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وبنهاية عام 7٠٠4‏ كان قد عقد ١1/‏ مؤثمرا لتَرِك 1181500. وعلى الرغم من 
تغير التفصيلات حول سلسلة ترك عبر السنين» كالمشاركين والمسارات (أي 
المشكلات الفرعية في استرجاع المعلومات)؛ ظلت أهداف أكبر جهد في التقييم في 
تاريخ تنظيم المعلومات واسترجاعهاء ى| هي. 


تصميم سلسلة مؤتمرات استرجاع النصوص: 

سلسلة مؤتمرات استرجاع النصوص 561165 111:00 على عكس تجارب 
كرانفيلد» مشروع تقييم مستمر» يضم فرقا مختلفة من المشاركين. وتقوم بعض هذه 
الفرق بتطوير النظم الخاصة بها لاسترجاع المعلومات»؛ ودائما ما تحصل الفرق التي 
تقرر المشاركة في مؤتمر بعينه» على المجموعة التجريبية» والمعلومات المتصلة بهاء التي 
يقدمها رعاة المؤتمر ومنسقو المسارات. ويتم الاسترجاع الفعلي في المقار الخاصة 
بالفرق المشاركة» وتقدم نتائج التقييم المتربعة على القمة للرعاة من أجل التقييم. 
كذلك تجتمع الفرق المشاركة في كل مؤتمر لاسترجاع النصوص., إبان الاختبار 
القبِلٍ أ5©)م. لتبادل وجهات النظر والخيرات» ووضع الخطط للمؤتر التالي 
لاسترجاع النصوص. 
الفرق المشاركة: 

تمثل الفرق المشاركة في مؤتمرات استرجاع النصوص (مثل بلكورء جامعة 
كارنيجي ملون تإأأوضء تلصتا سملاع81 عنزوعمهن) ,ع«مءاء8) القطاع التطبيقي 3 
والأوساط الأكاديمية» والمؤسسات الحكومية في الولايات المتحدة الأمريكية» ومن 
الدول الأخرى أيضا (كالصين وفرنسا على سبيل المثال). وكانت المشاركة في مؤتمرات 
استرجاع النصوص تتم في البداية بالدعوة فقطء إلا أنها الآن متاحة لكل من لديه 
القدرة على المشاركة في المشروع. ويشتمل الجدول رقم 0١‏ على أعداد الفرق 
المشاركة في المؤتمرات التسعة الأولى لاسترجاع النصوص. 
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وبإمكان الفرق المشاركة الاختيار من بين ثلاثة مستويات للمشاركة؛ المشاركة 
الكاملة» والمشاركة الكاملة باستخدام ربع مجموعة الوثائق التجريبية الكاملة؛ 
والمشاركة في التقييم فقط وذلك لكفالة حماية النظم التجارية لأسرار الخوارزميات 
التي تمتلكها (1995 مسقددع د؟). 


الجدول رقم /١١‏ 4 عدد الفرق المشاركة في مؤتمرات استرجاع النصوص 


.0 العام 
المؤتمر الأول ل 


المؤتمر الثاني ١‏ 
المؤتمر الثالث 


المؤتمر الرابع 





الوثائق التجريبية: 


لقد تم تجميع الوثائق التجريبية» في المقام الأول» من الصحف (مثل 56664 77/811 
لقد:نا0[). والشبكات الإخبارية 2618815155 (مثل شبكة أسيوشيتدبرس الإخبارية 
71751015 دوع 50618160وىق). وأنواع أخرى من المصادر (مثل السجل الاتحادي 
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#عاكزع 2 7076951 ). وكانت هذه الوثائق تصاغ بشكل موحد بلغة الترميز العامة 
المعيارية (5)58/1) ععقتناعممة منكسقلة لعمتلهمعدء© 10ةلسماف وتوزع على 
أسطوانات مكتنزة» سعة كل منها واحد جيجا بايت من البيانات. وقد بدأ المؤتمر الأول 
بأسطوانتين للبيانات التجريبية» ثم ارتفع عدد الأسطوانات المستخدمة في التجارب. في 
النهاية» إلى مس . وتشمل الأسطوانتان 6 وه على بيانات خاصة بالمهمة الخاصة 20 80 
غاقه) التي نتناولها فيا بعد. وتتراوح أطوال الوثائق مابين 550-7٠٠١‏ مصطلح. وعدة 
مئات من الصفحات. وتتكون المجموعة التجريبية من أكثر من مليون وثيقة. 

وقد أدى توسع مؤتمرات استرجاع النصوص في مسارات متعددة. إلى تصميم 
ويناء كثير من مجموعات النصوص المتبخصصة. وبالإضافة إلى تلك الوثائق الواردة في 
الجدول رقم 5/ ١‏ في المراجعة العلمية التي أعدها هارمان وفورهيس 1125288 
(2006) وععط1008 0وق. معت وثائق تجريبية أخر ى» لمسارات كالجينوم 
62012 ). والجوانب القانونية [1.©88. وبعبارة أخرىء فإن المجموعات التجريبية 
المستخدمة في المسارات الحالية» لم تعد كتلك التي تكونت للمسارات المبكرة» من 
حيث المحتوى والشكل والمجال. 
الموضوعات والاستفسارات: 

لقد كانت الموضوعات7**) الخاصة بالاسترجاع» يكتبها أناس تمن كانوا يفيدون 
فعلا من نظام الاسترجاع؛ وكانت مهيأة لتحاكي احتياجات المستفيدين الحقيقية. وكانت 
الموضوعات تبنى بإجراء عمليات استرجاع تجريبية» في مقابل عينة من مجموعة 
الوثائق» وبعد ذلك يتم اختيار تلك الموضوعات التي تحرز ما بين ١5‏ إلى ٠٠١‏ 


(*) الصحيفة اليومية الرسمية للولايات المتحدة الأمريكية. (المترجم) 
(**) تعني هنا الاستفسارات. (المترجم) 
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تسديدة 4قطء على وجه التقريب. في تلك العينة. وكان كل موضوع يصاغ بالطريقة 
المعيارية نفسها (أي بلغة الترميز العامة المعيارية 241 86: مع رقم تسلسلي» وعنوان 
قصير» ووصف مكون من جملة واحدة» وما ششنابه ذلك)» لكفالة ترتيب آلي أكثر 
سهولة للاستفسارات. وكانت الموضوعات الخنمسون نفسهاء تعد لمهمة التوجيه في 
كل مؤتمر من مؤتمرات استرجاع النصوص 134170» مع تكوين 5٠‏ موضوعا جديداء 
لكل مؤتمر من أجل المهمة الخاصة. وسوف نوضح بعد قليل ما يقصد بالمهمة الخاصة» 
ومهمة توجيه الاسترجاع الخاصة بمؤتمرات استرجاع النصوص. كذلك كان يتم 
أيضا إعداد موضوعات للتدريبء لكفالة تعرف المشاركين على مجموعة البيانات» 
التجريبية. وكانت جودة الموضوعات بالنسبة للمؤتمرين الأول والثاني عالية جداء إلى 
حد أنه كان من الممكن بلوغ مستوى جيد جدا للأداء» دون استعمال استراتيجيات 
التكشيف والبحث المرهقة بلا مبرر؛ ومن ثم. فقد تم إعداد الموضوعاتء بدءا من 
المؤتمر الثالث فصاعداء واضعين في الحسبان قدرا كبيرا من الواقعية» في الوقت الذي 
كانت تراعي فيه الاهتمامات التشخيصية في التقييم المختبري أو التجريبي 006مةم8) 
(2000 ووع2مل. 

وكانت الموضوعات تقدم كبيانات بالاحتياجات. لا كطلبات تقليدية» بناء على 
ثلاثة اعتبارات (28-29 .مم ,2005 ,تقصصد8 » و5ععط:0700). وأول هذه 
الاعتبارات أن يكون بإمكان الموضوعات التي تعد في شكل بيانات احتياجات» كفالة 
مدى واسع من طرق صياغة الاستفسارات. أما الاعتبار الثاني فهو أن يكون بإمكان 
الموضوعات بهذا الشكل؛ توفير المزيد من المعلومات لكل من المسئول عن إجراء 
عملية البحث ومن يقوم بالتقييم» يفيدان منها في إصدار أحكام الصلاحية. والاعتبار 
الثالث» أن يكون بإمكان الموضوعات من هذا النوع» تيسير إعادة استععال المجموعة 
التجريبية نفسهاء في المستقبل» لتجارب مختلفة؛ نظرًا لأن المعلومات التفصيلية التي 
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تتضمنها الملوضوعات جزء من المجموعة. ثم يتم بعد ذلك صياغة استفسارات 
الاسترجاعء بناء على الموضوعاتء آليا أو يدويا. وكان من الممكن للطريقة اليدوية أن 
تستخدم بقدر من المساعدة الآلية. وكانت بعض الاستفسارات الخاصة» تصاغ 
باستعمال التلقيم المرتد للصلاحية كل ةط0ع16 ععصووءاء5. 
مهام الاسترجاع: 

لقدتم في مؤتمرات استرجاع النصوص 11:10 اختبار نوعين من مهام 
الاسترجاعء وهما المهمة الخاصة 20 20. والتوجيه 0114188) وكانت المهام الخاصة 
تقابل الاسترجاع الراجع الا 117050 أي العثور على كل المعلومات حول 
موضوع معينء بين| كانت مهمة الاسترجاع بالتوجيه تضاهي البث الانتقائي 
للسلومات بالتفررهل المتومات اق اضدث جديا حول :سارها 

وبدءا من المؤتمر الرابع» أدخلت مجموعة من مهام الاسترجاع الإضافية» تركز 
كل واحدة منها على مشكلة استرجاع فرعية معينة. وقند أوضحت سبارك جونز 
(2000) 025ل عاعقم5 ما يتعلق بالمسارات بصياغة التناظر الملائم التالي: 


من الممكن النظر إلى مؤتمرات استرجاع النصوص برمتهاء على 
الخاصة 80 80) ومكابح دوارة (المسارات)» ترتبط كل منها 
بالمحور» وتسلم الوطار بعضه| لبعض. ومن الممكن إدخال المكابح 
الجديدة» وتقوية المكابح القائمة» أو نزع المكابح البالية. وبذلك يمكننا 
البحث عن دولاب استرجاع للمعلومات في ترك دائم التحسن» 
وليس بمجرد كوابح أكثر وأفضل فعلاء وإنم) بإعادة تصميم المحور 
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ويشتمل الجدول رقم /١١‏ 5 على المسارات التي تمت تغطيتهاء بدءا من المؤتمر 
الرابع حتى المؤتمر العاشر» الذي يعرف أيضا بمؤتمر .2٠١١‏ والواقع أن مؤتمرات 
استرجاع النصوص. منذئذ كانت تميز بالعام على نحو مطرد (ترك 5٠١7‏ وترك 
4 على سبيل المثال) بدلا من خطة الترقيم السابقة. ويشتمل الجدول رقم 5/١١‏ : 
على المسارات التي تم إجراء التجارب فيهاء من ترك ٠٠١7‏ حتى ترك .٠٠١9‏ 
واعترافا بوجود بنية أساس كافية لدعم الباحثين المهتمين بمهام الاسترجاع الراجعء 
توقفت المهمة الخاصة في ترك -4) بحيث أصبح من الممكن تخصيص المزيد من موارد 
ترك لإقامة بنية أساس لتقييم المسارات (2000 روععط00؟؟). 1 


الجدول رقم /١١‏ © نظرة عامة على مسارات ترك: ترك هد ا وش 





(*) نظام للاتصالات اللاسلكية. (المترجم) 
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بعالك اللقة 
الطبيعية :1/1 


جهاز تشغيل 
الوسائط 571.6 





استرجاع 
المعلومات عبر 
اللغات 001:11 


ونظرا لاندماج مهمة التوجيه مع مسار التنقية» منذ ترك-/؛ أصبحت جميع 


مهام الاسترجاع التي تم استكشافها في مؤتمرات استرجاع النصوصء بدءا من ترك- 
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الجدول رقم 5/1١‏ نظرة عامة على مسارات ترك: ترك ٠٠١7‏ حتى ترك 5٠١4‏ 


4 





2 
0 ١ 





وبحلول عام ٠٠١4‏ كان قد نشأ أكثر من عشرين مساراء الأمر الذئ يدل على 
نقاط تركيز بحوث أوساط استرجاع المعلومات في ذلك الوقت. وبين| توقفت بعض 
المسارات» أنشئت مسارات جديدة لدراسة المشكلات الناشئة في استرجاع المعلومات. . 
واعتمادا على النظرات الشاملة» والانطباعات التي حظيت بها مؤتمرات استرجاع 
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النخصوص التي عقدت (راجع على سبيل المثال عه 2قتصمق]8 ,1995 رسقصسمد1] 
1121213 عت و5و0016؟ :2000 ,1995 ,روعصول عاء مم5 :20064 روععط»م0ه؟1 
5» وفيم| يلي وصف موجز لكل مسارء في ترتيب هجائي'*: 
» مسار المدونات عاع2* 8108 بدأ في مؤتمر 2350١5‏ لاستكشاف سلوكيات 
البحث عن المعلومات, في مجال المدونات. وكان هذا المسار لا يزال جاريا في 
مؤثمر .5١١9‏ 
» مسار استرجاع المعلومات الكيميائية 53616 112 1111621©: أحد مسارين 
جديدينء أضيفا في مؤتمر ٠٠١4‏ (إلى جانب مسار الكيانات (4ناس18)» 
ويسعى إلى تطوير وتقييم التقنيات الخاصة بإجراء عمليات البحث واسعة 
المدى» في الوثائق الكيميائية» با في ذلك البحوث الأكاديمية ويراءات 
الاختراع. والمستفيدون المستهدفون من هذا المسار هم اختصاصيو عمليات 
البحث عن المعلومات» وخصوصا باحثو براءات الاختراع والكيميائيون. 


© مسار التشويش تاه دوأكت كسم وكانيمثل الجهود التي تبذل مع 
البيانات المحرفة 60110240. التى يمكن أن تتأتى» على سبيل المثال» نتيجة” 
للتحقق من الأحرف بصريا (06©018.؛ أو المدخلات الناطقة أو المسموعة. 
وتسمى بيانات ذلك الطابع أيضا بالبيانات المشوشة أو المحرفة. وقدتم 
تطبيق هذا المسار في المؤتمرين الرابع والخامس» وهو يتصل بالبحث المشوش 
نا الذي نوقش في /١5‏ ؟/ ١‏ في هذا الكتاب. 

© مسار اسثر جاع المعلومات عبر اللغات 1240100124102 ع28نا328.آ-0055) 
خل12 (1.:11ن)) 6921 1ماء1؛ وهو مسار تغطى فيه الوثائق عدة لغات 


(*) وفقاً لأسرائها باللغة الإنجليزية بالطبع. (المترجم) 
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(كالإنجليزية» أو الفرنسية» أو الألمانية» أو الإيطالية على سبيل المثال) وتغطى 
الموضوعات بكل لغة من هذه اللغات. ويركز هذا المسار على استرجاع 
الوثائق بإحدى اللغات المستهدفة» باستعال موضوعات كتبت بلغة مختلفة. 
كذلك كان المشاركون يجرون أشواطا أحادية اللغة في اللغة المستهدفة لتكون 
بمثابة الحد الأساس أو العتبة. وكان هذا المسار يركز في المؤتمر العاشرء على 
استرجاع الوثائق باستعمال موضوعات بالإنجليزية أو الفرنسية. وقدتم 
تطبيق هذا المسار لآخر مرة في مؤتمر 7٠١7“‏ إلا أن المزيد من جهود البحث. 
في هذا الموضوع تواصلت في كلف '1.17) (منتدى التقييم عبر اللغات 
نارهظ 119812155 عق هناو دنة.1 2055))): والمجموعة التجريبية لنظم 
استرجاع المعلومات بالمعهد الوطني للمعلوماتية 06 عغتغتاكصة لهصمنهواح 
(خ511)011) كددعاوزك غ11 :10 سمناءء0011) أدوع1' '12102320125. وقد 
تناولنا كلا الموقعين في 4/ /١‏ 7. 


مسار إدماج مراصد البيانات كلع78) عضاع:812 عكةط 18212 وقد طبق هذا 
المسار في المؤتمرين الرابع والخامس فقطء ودرس الطرق الخاصة بمعاجة 
المجموعات غير المتجانسة» كالخروج بترتيب طبقي واحد للوثائق الخاصة 
بالاستفسارات» حين) تكون مجموعات البيانات التي يتم الاعتتاد 
مسار المشروع ك8 ع15دم,1م8؛ الذي بدأ في مؤتمر »,3٠١5‏ .يدف 
دراسة البحث عن المشروعات (عندما يكون المستفيد بصدد البحث عن 
بيانات إحدى المنظماتء أو في بيئة مؤسساتية)» وتوقف في مؤتمر 8 .٠٠١‏ 


© مسار الكيانات 1886 1084165؛ وهو أحد مسارين جديدين ندا في مؤتمر 
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بيانات العتكبوتية. وتتعلق مهام الببحث هذه (كالعثور على الكيانات 
وخصائص الكيانات على سبيل المثال) بالاحتياجات المعلوماتية المألوفة» التي 
لم تصبح بعد على غرار عمليات البحث الخاصة عن الوثائق. 

« مسار التنقية 5866 8هة166ؤ1؛ الذي ينظر إليه بوصفه الشكل” الحقيقي” 
لمهمة التوجيه؛ التي أدمجت مع هذا المسار منذ المؤتمر السابع. ويتعلق مسار 
التنقية بالمهام التي تتسم فيها الموضوعات بالثبات» فضلا عن معرفة بعض 
الوثائق الصالحة. إلا أن هناك تدفقاً في الوثائق الجديدة التي تضاف إلى 
النظام. ويتعين على النظام» بالنسبة لكل وثيقة» أن يتخذ قرارا ثناتياء إما 
استرجاع الوثيقة أو تكوين قائمة طبقية. وقد توقف هذاالمسار في مؤتمر 
٠7‏ ٠”ء‏ بعد ثمانية أشواط. 

» مسار دراسات الجينوم غل58] 22620152105 وكان مصم| لاستكشاف مهام 
الاسترجاع. في مجال يبدي اهتاما ببيانات دراسات الجينوم. وقد استمر من 
مؤتمر 7٠٠7‏ حتى مؤتمر .2٠01/‏ وقد حددت معالم بيانات دراسات الجينوم 
في هذا المسار» بصورة عامة» بحيث لا تشمل مجزد سلاسل الجينات فحسب» 
وإنما لدعم التوثيق أيضاء كالأوراق البحثية وتقارير المختبرات» التي تغطي 
مدى واسعا من المعلومات في المجال. 

© مسار الاستر جاع عالي الدقة من الوثائق 1036921 وعدسدعءعم4 طون 

ته علءة زمارد 2ل1خ11) كأسعسسهه8؛ الذي نشأالتحقيق 

الاسترجاع عالي الدقة» بالاستفادة من المعلومات الإضافية حول من يقوم 
بإجراء عمليات البحث؛ أو حول سياق البحث. وتشمل الأساليب التي 
طبقت في هذا المسار استرجاع المقاطع» و التفاعل المستهدف مع من يقوم 
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بإجراء عمليات البحث. وقد استمر هذا المسار من مؤتمر ٠٠١٠"‏ حتى 
مؤتمر ,.5٠١60‏ 

مسار التحقيق المرتفع خاع 12 صمزولءء20 طع111» الذي اختبر فاعلية وكفاءة 
واجهات المستفيدين الخاصة بالنظم المشاركة في المؤتمرين السادس والسابع. 
وباستخدام مجموعة الخمسين نفسها موضوعاء وكما استخدمت الوثاق في 
المهمة الخاصة» كان يطلب من المستفيد العثور في غضون خمس دقائق, على 
عشر وثائق تجيب عن السؤال. ولم يكن بإمكان المستفيدين التعاون معافي 
سؤال واحد, كا لم يكن بإمكان النظام أو المستفيد أن تكون لديه معرفة 
مسبقة حول السؤال. ومن ناحية أخرى كانت لدى المستفيد حرية الرجوع 
إلى أي مصدر متاحء مادام زمن الاسترجاع لا يزيد عن الدقائق الخمس. 
المسار التفاعلي عل2) 12162201976 وهو مهمة خاصة بدراسة تفاعل 
المستفيد مع نظم استرجاع النصوصء وتطوير مناهج لتقييم التفاعل. وكانت 
هذه المهمة» في المؤتمر العاشرء تنطوي على ملاحظة الأفراد الذين يفيدون من 
العنكبوتية الحية» لإنجاز مهام محددة (2002 رسقدمة]1] 6 6 00 . 
وقد طبق هذا المسار لآخر مرة في مؤتمر .3٠0١7‏ بعد أن أصبح مسارًا في ثانية 
مؤترات متتابعة. 

المسار القانوني غاع82؟ لهععآء الذي بدأ في مؤتمر »35٠١5‏ ليحاول تطوير 
تقنية بحث تلبي احتياجات المحامين» ومساعدتهم في العثور على المعلومات 
بفاعلية» في مجموعات الوثائق الرقمية. وكان لا يزال جاريا في مؤتمر 9 .7١5١‏ 
مسار المليون استفسار كاءع8:) :ع0 84111105 الذي بدأ عام /1 ٠٠١‏ وهو 
عمائل للاسترجاع الخاص المعياري» ولكن مع اختلاف في التركيز. وقد قصد 
بهذا المسار على وجه التحديد؛ تقييم أعداد كبيرة من الاستفسارات (ومن هنا 
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سمي بالمليون استفسار)؛ على نحو غير مكتمل؛ بدلا من عدد قليل من 
الاستفسارات على نحو أكثر اكتمالاء كى| كان يتم في المهام الخاصة السابقة 
وظل مسارا في مؤتمر 4 .5٠١‏ 

المسار متعدد اللغات كلع8] 1[ةنا34131411188: الذي كان ينظر في قضايا 
الاسترجاع في اللغات غير الإنجليزية. وقد أجري اختبار إسباني تمهيدي في 
المؤتمر الرابع» ليضنيخ مسارا رسميا في المؤتمر المنامس. كذلك تمت دراسة 
الاسترجاع بالصينية في المؤتمرين الخامس والسادس. وقد تواصل المزيد من 
البحث حول ل المعلومات متعددة اللغات. في منتدى التقييم عبر 
اللغات (كلف "01:11)) والمجموعة التجريبية لنظم استرجاع المعلومات 
بالمعهد الوطني للمعلوماتية (08710:118) اللذين تناولناهما في 4/ ."/١‏ 

مسار معالحة اللغة الطبيعية (©,.آ81) عتأووعع2::0 عع 2ناع2هرآ لدعدنول1 
4315 الذي استكشف. في المؤتمرين الخامس والسادسء ما إذا كانت 
أساليب معالجة اللغة الطبيعية (النظمية عذا“18ه59 والدلالية عتأسهقممءة) 
المتاحة» ناضجة ب| فيه الكفاية» ليكون لا تأثيرها على استرجاع المعلومات» 
وما إذا كان بإمكان هذه الأساليب أن تحقق تميزا على طرق الاسترجاع الكمية 
البحث (كالإحصائية مثلا). 


مسار الجحدة خا452 71076163) الذي درس» من مؤتمر 7٠٠١"‏ حتى مؤمّر 
4 قدرة النظم على العثور على المعلومات الجديدة (أي غير المكررة) 
والصالحة. وقد اعتمد هذا المسار على خمسين من أسئلة المؤتمرات القديمة 
لاسترجاع النصوصء باستخدام قائمة طبقية ثابتة للوثائق الصا حة المعروفة. 
* مسار الاستفسار كل48 '0106339)» الذي بدأفي المؤتمر السابع» لتشجيع 
البحث حول تأثير قابلية الاستفسارات للتغير» وتحليل الاستفسارات؛ على 
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أداء الاسترجاع. وقد قام كل فرد من المشاركين بصياغة عدة أشكال مختلفة» 
من أسئلة مؤتمرات استرجاع النصوصء الموجودة فعلاء مع التركيزء في 
معظم الأحيان, على الأشكال المختلفة للأسئلة بلغات طبيعية مختلفة. ثم 
قامت جميع المجموعات بتطبيق مختلف الصيغ. وقد تحول المسار إلى" محطة 
للبحوث" بعد المؤتمر التاسع» وموقع لمؤتمرات استرجاع النصوص على 
العنكبوتية عأأوطاء؟7 :118150 (2151.807.]), ليكون الآن بمثابة مستودع 
لكل من صيغ الاستفساراتء ونتائج الاسترجاع التي أسفرت عنها 
تلك الاستفسارات. 

مسار الإجابة عن الأسئلة ع3 (04)) عتناتاء ؟اكدسة لاوتادوء2))01 الذي 
بدأ في المؤتمر الثامن» لاتخاذ خطوة أكثر اقترابا من السرياغ المعلومات (أي 
استرجاع المقاطع) وليس استرجاع الوثائق. ولأغراض أسئلة الاختبار» 
أنتجت النظم مقتطفات نصية تجيب على الأسئلة. وكان للأشواط المختلفة 
حدود مختلفة لأقصى طول للمقتطفء يتراوح بين عبارة موجزة (كلمتان أو 
ثلاث) إلى الوثيقة برمتها (ألف كلمة). وقد أجرى المؤتمر العاشر دراسة 
استرشادية» بأسئلة كانت تتطلب معلومات من وثائق متعددة» لتتجمع 
لتشكل إجابة صحيحة (2002 ,112333 نىّ وع17001:16). وقد توقف هذا 
المسار بعد مؤثمر لا٠١5.‏ 

مسار تلقيم الصلاحية المرتد علع 12 علعقطلءع1 ععصدوعاء8: الذي يخطط 
لوضع إطار لاستكشاف تأثير العوامل المختلفة على نجاح تلقيم الصلاحية 
المرتد» وهو أسلوب يستخدم على نحو متزايد في استرجاع المعلومات. وقد 
طبق هذا المسار في مؤتمر 7١٠١4‏ وتواصل في مؤتمر .7٠١9‏ 
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© مسار الاسثر جاع القري خلع8) 26216781 )قتاط0غ1» وهو استمرار لمسار 
العنكبوتية 681 88965), انطلق في مؤتمر 7 »35٠١‏ وكان يشبه مهمة 
الاسترجاع الخاصة التقليدية» إلا أنه كان يركز أكثر على فاعلية السؤال 
الواحدء وعلي نحو أقل؛ على متوسط الفاعلية. وعلى الرغم من توقف هذا 
المسار بعد مؤتمر 7٠٠8‏ فإن بعض البيانات التي أسفر عنها تستعمل في مهام 
خاصة أخرى. 


مسار البريد المزعج 18616 /5241.: الذي بدأ في مؤتمر 23٠٠٠١0:‏ لإجراء 
تقييم معياري للطرق ال حالية والمقترحة لتقنية البريد من الرسائل المزعجة. كم] 
كان من المتوقع أيضا وضع الأساس في| بعد لتقييم المزيد من المهام العامة 
لتنقية البريد الإلكتروني واسترجاعه. وقد توقف هذاالمسار بعد 
مؤثمر /ا١١5.‏ 

مسار استر جاع الوثائق الناطقة (51(12) [16821اع1 اأسعتسدء120 مععاممم 
431» الذي ورث مسار التشويشء؛ ودرس قدرة نظام الاسترجاع على 
استرجاع الوثائق الناطقة (أي التسجيلات والأحاديث). وقد بدأ هذا المسار 
بدعم من جماعة الحديث في المعهد الوطني للمواصفات المعيارية والتقنية 
(نست '01151. وقارن المشاركون فيه فاعلية نظامهم للاسترجاع :اعتمادا على 
نصوص بشرية للأخبار الإذاعية» ونصوص من إنتاج نظام أساس للتعرف 
على الحديث» واختياريا على نصوص من إنتاج من يتعرفون على الحديث. 
وقد توقف هذا المسار في المؤتمر العاشر. 


مسار التيرابايت لع13 عغل(طة:ع1, الذي طبق لأول مرة في.مؤتمر ٠5٠١5‏ 
وكان هدفه دراسة ما إذا كان من الممكن؛ وكيف لأوساط استرجاع 
المعلومات مقارنة التقييم المعتمد على مجموعات تجريبية تقليدية لاسترجاع 
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المعلومات» ومقابل مراصد بيانات أكبر على نحو ملحوظ من تلك 
المستخدمة في مؤتمرات استرجاع النصوص وقتئذ. وقد طبق هذا المسار لآخر 
مرة في مؤتمر 5 .5٠١‏ 

مسار الرصيد بالغ الضخامة غلءعة*] (0)آ17) عنام0ن) عوتتها وعو لل 
الذي طبق تجريبيا في المؤتمر الخامس» وتوقف بعد ال مؤتمر السابع» وأنجز 
عمليات بحث خاصة على حوالي ٠١‏ جيجا بايت 78© 20 من النصوص» 
لاستكشاف فاعلية وكفاءة الاسترجاع. وكان المشاركون فيه يتم تقييمهم بناء 
على دقة استرجاع الوثائق العشرين المتربعة على القمة» وزمن الاستجابة 
بالنسبة للاستفسار وزمن بناء نظام البيانات» فضلاً عن بعض مقاييس 


: التكلفة. 


مسار الفيديو كاء18 9871060 الذي استجد في المؤتمر العاشرء وكان يركز على 
التعامل القائم على المحتوى مع الفيديو الرقمي»ء لمواصلة اهتتمام مؤتمرات 
استرجاع النصوص باسترجاع الوسائط المتعددة © وععط700؟) 
(2002 ,8585333. وكان الاهتام بهذا المسار واضحاًء على الرغم من وجود 
تداخل في التقنيات الخاصة باسترجاع الفيديو وتقنيات استرجاع النصوص. 
ونتيجة لذلك انفصل المسار عام ٠٠7"‏ 27 كجهد تقييم مستقل» يسمى تركفيد 
(7710عع:5]/ساعء [10م /251.507. "املاط 09597 1101:0910 

مسار العنكبوتية غ131 77 ويمثل مهام خاصة. مجموعة وثائقها مقتطفة 
من العنكبوتية العالمية 717 178/106 7801:10. وتنطوي المهمة الرئيسة على 
حوالي ١١‏ جيجا بايت 213) 10 من بيانات العنكبوتية. وكان المشاركون فيه 
يحظون بالتشجيع لدراسة مجموعة متنوعة من استراتيجيات استرجاع 
العنكبوتية» على غرار ما إذا كان من الممكن استخدام الروابط لزيادة سرعة 
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الاسترجاع. وقد بدأ هذا المسار في المؤتمر الثامن» وتوقف بعد مؤتمر 5 .٠٠١‏ 
إلا أن مسار العتكبوتية أعيد ثانية في مؤتمر 9 ٠٠١‏ لاستكشاف مهام استرجاع 
ترتبط بالعنكبوتية على وجه التحديد. تشمل مهام التنوع والكفاءة» 
ومجموعات تتكون من ما يصل إلى بليون صفحة من صفحات العنكبوتية. 
وبالمقارنة بسلفه في) بين المؤتمر الثامن ومؤتمر 5 .»7٠٠‏ كان من الممكن للمسار 
الراهن أن يستخدم زواحف عنكبوتية 8181© 68 أكبر وأحدث على غرار 
جموعة الوثائق. 3 
ويوضح وصف جميع المسارات هذاء حجم ومدى مهام الاسترجاع التي تمت 
دراستها في مؤتمرات استرجاع النصوص. وقد تهاوزت بعض المسارات فعلا 
الأهداف التي حددت لا في البداية؛ فمؤتمرات استرجاع النصوص في جوهرهاء على 
سبيل المثال» مشروع لتقييم استرجاع النصوص. إلا أن مسارًا حول استرجاع الفيديو 
طبق فعلا في المؤتمر العاشر. ومثل هذه المسارات» ى) ذهبت سبارك جونز كاعءتتقم5 
(2000) 5عول» امتدادات لمؤتمرات استرجاع النصوص. يضاف إلى ذلك» كما ألمح 
هارمان وفورهيس (2006) 1700:2665 220 تقد رة11, في الشكل رقم 5/ ” ني 
بحثهماء إلى أن معظم المسارات التي طبقت بدءا من المؤتمر الأول حتى مؤتمر 273٠١‏ 
تدخل في الفئات التالية (مع إضافة المسارات التي بدأت بعد مؤتمر .3٠٠١7“‏ حيثما كان 
ذلك ملائها): 


٠‏ النصوص الثابتة: المسارات» والخاص» والقوي. والتلقيم المرتد للصلاحية. 
. النصوص المتدفقة: التوجيه» والتنقية. 


« البشرية: التفاعلي والاسترجاع عالي الدقة من الوثائق 114185 
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« خارج نطاق الإنجليزية: متعدد اللغات» واسترجاع المعلومات عبر اللغات 


+1آعان). 
٠.‏ خارج نطاق النصوص: التشويش» واسترجاع الوثائق الناطقة» والفيديو» 
* البحث في العتكبوتية: الرصيد بالغ الضخامة؛ والعنكبوتية؛ والتيرابايت: 
والكيانات. 


٠‏ الإجابات وليست الوثائق: إجابة الأسئلة» والحدة. 


« المجال: دراسات الجينوم, والمشروع» والقانوني» واسترجاع المعلومات 
الكيميائنة. 


التقييم وأحكام الصلاحية: 

استخدم التقييم في مؤتمرات استرجاع النصوص 11810 مقياسي الاستدعاء 
والتحقيق التقليديين» ومن ثم فقد كانت أحكام الصلاحية ضرورة لا فكاك منها. 
وكان أولئك الذين صاغوا الأسئلة» مشاركين أيضا في التقييم أحيانا. وكانت طريقة 
التجميع البؤري 35اذ001م: التي تناولناها في /1١/7/1١/١١‏ 7 تستخدم لتشكيل 
تجمع البيانات للتقييم» في جميع مؤتمرات استرجاع النصوص. وكان كل فريق مشارك 
يقدم للرعاة الوثائق المئة المسترجعة المتربعة على القمة» في كل شوطء وذلك لسؤال 
بعينه؛ نظرا لتطبيق خوارزمية للترتيب الطبقى في جميع نظم الاختبار» وذلك على نتائج 
مخرجات الاسترجاع؛ بناء على الصلاحية المنتظرة. 

وكان كل مشارك في التقدير يحكم في المتوسط على حوالي ٠٠٠١‏ وثيقة» لكل 
سؤال. وكان اكتمال الأحكام واطرادها في مؤتمرات استرجاع النصوصء يراجعان في 
دراسات منفصلة. وقد بدت النتائج تبدو إغجابية (2000 وتتهتط :113 ع د5عع:00؟). 


ءفك 


وكانت هناك حزمة تقييم معيارية» تستخدم لتسجيل نتائج كل شوط من الأشواط التي 
يتم إنجازها. وكان مقياس التقييم الأكثر كثافة في الاستعمال» في مؤتمرات استرجاع 
النصوصء هو التحقيق المتوسط الذي نوقش في /١/7/١/١١‏ 5. كما كان يتم أيضاً 
حساب أنواع أخرى من مقاييس التقييم المعتمدة على الاستدعاء والتحقيق» في مؤتمرات 
استرجاع النصوص. وقد لخصت سبارك جونز (2000) 5عهول عكفم5 مقاييس أداء 
المسارات التي طبقت»ء بدءا من المؤتمر الرابع حتى المؤتمر السادس. كذلك قدم باكلي 
وفورهس (2005) 500512655 320 إعلكلءنة8 وصفا ضافيا لمفاييس التقييم التي., 
استخدمت في مؤتمرات استرجاع النصوص . إلا أن جميع مقاييس التقييم لم تكن تقيم 
سوى أداء الاسترجاع؛ نظراً لأنبا كانت جميعها أشكالاً ختلفة للتحقيق والاستدعاء 
تاركة الأبعاد الأخرى لنظم استرجاع المعلومات دون مساس. ومن ثم؛ فإن سلسلة 
مؤتمرات استرجاع النصوصء تعالج مقاييس التجقيق والاستدعاء المرتفعين» بوصفههم| 
هدفها النهائي» وليسا هدفا فرعيا (2008 رههكاتزءع80). 


نتائج مؤتمرات استرجاع النصوص: 
لقد أسفرت مؤتمرات استرجاع النصوص عن نتائج كثيرة جداً» متنوعة بحيث 
يصعب حصرها في هذا السياق؛ ومن ثم فإننا نلخص النتائج العامة فقط 
على النحو التالي: 
» هناك كثير من الطرق المختلفة تمام الاختلاف التي تؤدي على مستوى مشابه» 
الأمر الذي يدل على أن ”جميع الطرق تفضي إلى روما“» فمن الممكن للطرق 
المختلفة أن تسعى لتحقيق الهدف نفسه. 
٠‏ يعمل التجهيز الآلي (أي صياغة الاستفسارات أو ناتج الاسترجاع) 
بكفاءة التجهيز اليدوي نفسها إلا أنه قد لا يبدو مقنعاً تحاماء بالنسبة 
للاستفسارات البسيطة. 
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تبدو أساليب التكشيف والبحث. القائمة على الإحصاء. منخفضة التكلفة 
وكافسية ةو عتضوما بالدلية التحتوغات أوسامتيو النانات الشسية: 
ومن الممكن لهذه الأساليب أن تعمل على نحو أفضل بكثير» من النطوط 
الأساس للمصطلحات البسيطة» على الرغم من أنه من الممكن لهذه 
الأساليب أن تصنف ضمن نوع ما من التدريب الجماعي. 


تسهم العبارات البسيطة؛ إلى جانب المصطلحات المفردة» بثبىء ماء ممايدل 
على وعد إضافي بالنسبة للطرق الآلية في المجال. : 


لا يبدو توافر تلقيم الصلاحية المرتد» وكذلك التوسع المعتدل في 
الاستفسارات مفيداً. إلا أنه ليس هناك في مؤتمرات استرجاع النصوص» 
تقدم يذكر نحو هدف صياغة استفسار واحد فعال» وذلك في مقابل تصنيف 
الاستفسارات والاستراتيجيات وفقاً للمهام الخاصة. وبعبارة أخرىء فإن 
النظام لا يزال عاجزاً عن تحليل الطلب» وفقاً لمضامين صياغة مصطلحاته 
لبآ وأختهار استراتيجيةمنعيئة لصياغة الاستفسنارات» يمكن أن نسفر عبن 
أفضل النتائج. 


مشكلات مؤتمرات استرجاع النصوص: 


النقد الرئيس الذي يوجه لمؤتمرات استرجاع النصوصء أنها سارت في 


الأساس على خطى تجارب كرانفيلد» باستعمال بيئة اختبار اصطناعية» وباتخاذ 
الاستدعاء والتحقيق مقياسين لآداء الاسترجاع. 


واصطناعية سلسلة مؤتمرات استرجاع النصوص ثلائية الأبعاد؛ أوهما أن 


الوثائق التجريبية التي استخدمت في المؤتمرات المبكرة» التى كانت تتكون في المقام 
الأول من الصحفء كانت تجمع خصوصاً للمشروعء ولم تكن مجموعة تكونت طبيعياً 
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عل هر التين: :وين يمك للضحك أن تكون مصدرا ف] بالتسة لأغرافن أخرى 
كثيزة» فإنها لا يرجع إليها بكثافة فيا يتعلق بمعظم جهود البحث العلمي. ثانياء ‏ 
يكن لسلسلة مؤتمرات استرجاع النصوص مستفيدون حقيقيون متمرسون؛ فقد 
كانت الأسئلة أو طلبات البحثء كم في كرانفيلد» مصنعة خصوصاً من أجل 
المشروع. وكان الاسترجاع يتم بواسطة من قاموا بتطوير النظام» كما كان أداء 
الاسترجاع يحكم عليه من قبل مقيمين ربا يكونون تمن صاغوا الأسئلة أيضا. ثالثاء 
كانت التجارب تتم في بيئة مختبر تقليدي؛ بدرجة معينة من الانضباط وال معالجة. ولا 
يمكن ربط مثل هذه البيئة التجريبية بالنظم العاملة الحقيقية. 

وفضلاً عن ذلكء هناك مشكلات تتعلق بطريقة التقييم المتبعة في مؤتمرات 
استرجاع النصوص؛ فأوجه القصور التي تكتشف استخدام الاستدعاء والتحقيق 
كمقياسين لتقييم أداء الاسترجاع» من ناحية, ماثلة تماما في مؤتمرات استرجاع 
النصوص؛ نظراً لأن الاستدعاء و التحقيق هما المقياسان الرئيسان اللذان وقع عليهما 
الاختيار للتقييم في المشروع. ومن ناحية أخرىء لم يتم لأغراض التقيبم» تجميع سوى 
النتائج المتربعة على القمة» المسترجعة من كل نظام؛ ومن ثمء فإن تقديرات مؤتمرات 
استرجاع النصوص يمكن أن تبدو أفضل مما كان يمكن أن تكون عليه في حالة تغطية 
التقيبم لكل النتائج. ووفقاً لبحث أعده زوبل (1998) 20061) فإن الاستدعاء في 
مؤتمرات استرجاع النضوص:ء كان تقديره ينطوي على مبالغة. وفضلاً عن ذلك؛ تبدو 
الحاجة إلى المزيد من التقييم الإحصائي واضحة؛ نظراً لأن منحنيات الاستدعاء في 
مقابل التحقيق» التي قدمها كل فريق مشارك» كانت متقاربة في معظم الأحيان» 
وهناك حاجة للتحقق مما إذا كانت هناك فعلاً أي فروق ذات دلالة إحصائية بين نتائج 
نظامين» أو مجموعتين من نتائج النظام نفسه. كذلك يبدو من الضروري تجاوز حدود 
المتوسطات؛ لفهم أداء النظم على نحو أفضل. يضاف إلى ذلك أنه من إلصعب بمكان 
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إجراء تحليل للإخفاق على النتائج؛ نظراً لضخامة عدد الوثائق التجريبية التي شملتها 
التجاربء والحد الموضوع لمخرجات الاسترجاع (1995 ,88م:118). وقدتمت 
الإشارة أيضاً إلى غياب تحليل الإخفاق في سلسلة مؤتمرات استرجاع النصوص» من 
جانب روبرتصون (2008) 180502. 

وتتبع مؤتمرات استرجاع النصوص إجمالء نبج الصندوق الأسوده بالنسبة 
للتقييم؛ إذ تتم المقارنة بين النظم ككتل لأغراض قياس الأداء؛ عن طريق التتائج التي 
استرجعتها فرق البحث (2000 ووعه0ل علءمقم6). وم يتم التوصل إلى معلومات 
تذكر حول ما يمكن أن يكون لاستراتيجيه معينة؛ أو أداة من قدرة على تغيير أداء 
النظام» وذلك على الرغم من أن مؤتمرات استرجاع النصوص كانت تعقد منذ عام 
7 . وهناك حاجة واضحة إلى نبج الصندوق الزجاجي الشفاف من أجل مهمة 
التقيبم. وكررت سبارك جونز (2006) 70265 عاعقم5 الإعراب عن هذه الحاجة. 
بالدعوة إلى انتباه مؤتمرات استرجاع النصوص للتعامل لأدق الدقائق المميزة» في تقييم 
استرجاع المعلومات. 
أهمية مؤتمرات استرجاع النصوص: 

بكثير من خصائصها الفريدة (كحجم الوثائق التجريبية والعدد المتزايد للمرق 
المشاركة على سبيل المثال) تشغل مؤتمرات استرجاع النصوص موقعاً مهما في تاريخ 
تقييم تنظيم المعلومات واسترجاعها. وقد اتضحت أهمية سلسلة المؤتمرات هذه في 
الحوانب التالية: 

أولأ» أنها توفر متتدى منفتحاً ومشجعاً بالنسبة لتقييم تنظيم المعلومات 
واسترجاعها. ولأنها منتدى منفتح؛ فقد شجعت على المشاركة من جانب كثير من 
المؤسسات والمنظيات في الداخل والخارج. ولأنها منتدى مشجع؛ فقد حثت المشاركين 
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على إدخال المزيد من التحسينات على نظمهم؛ فقد حدث بالفعل على سبيل المثال» أن 
تمت ملاحظة تحسينات مهمة في أداء الاسترجاعء في المؤتمر الثاني عما كان عليه ا حال في 
المؤتمر الأول (1995 روعصمل علءسقم8). 

ثانا تمت تجربة الكثير من الأساليب المختلفة في مؤتمرات استرجاع النصوص؛ با 
في ذلك استرجاع المقاطع أو الفقرات» ودمج البيانات» والتكشيف الإحصائي 
والتكشيف الاحتالي» واستراتيجيات وزن المصطلحات. أما تقنية الاسترجاع البولينية» 
فعلى الرغم من أهميتهاء فإنه لم تكن لها الغلبة في المشروع. وفضلاً عن ذلك؛ فإن حجم 
المجموعات التجريبية يبلغ الآن ما يقدر بالجيجابايت لا بالميجابايت» ى] كان في جهود 
التقييم المبكرة» وبذلك تصبح هذه المجموعات أكثر اقترابا من موقف الحياة الواقعية» من 
حيث الحجم. ولقد كانت مؤتمرات استرجاع النصوص تتطور نحو ما يضاهي بيئة العمل 
الواقعية» التي تكفل نقل نتائج التجارب لتدخل في المنتجات التجارية» وذلك بعائدات لا 
يمكن إنكارها (2000 ,لإتناط2123 يت تتادلة160). ونظم استرجاع الإنترنت أمثئلة 
بارزة لثار ببحوث مؤتمرات استرجاع النصوص. ولقد كانت قدرة هذه النظم على توجيه 
المستفيدين نحو ما يبحثون عنه من معلومات» أمرا جوهريا بالنسبة لنجاح العنكبوتية 
(2006 رعععط700١ا‏ عت سمدصحدد11). 

الثآء تبدو مؤتمرات استرجاع النصوص أكثر قابلية للتعميم» من كثير من 
المشروعات الأخرىء ويرجع ذلك جزئياء إلى أن هذه المؤتمرات جهد بحثي متواصل. 
إذ إنها تحاول الإجابة على كثير من التساؤلات» التي يمكن وضعها في مثل هذه الفتات 
العريضة؛ كنماذج التكشيف والاسترجاع» ولغات التكشيف. ووصف الوثائق» 
ومصادر التكشيف. والاستفسارات» ومصادر الاستفسارات» واستراتيجيات 
البحث؛ ومعايير احتساب النقاط» وقدرة نظم استرجاع المعلومات على التعلم 
(2000 موعصمل عاععقمه). 
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ويمكن القول إجمالآًء إن مؤتمرات استرجاع النصوص على قدر كبير 
من الأهمية بالنسبة للمجال. كذلك تم اقتراح احتمالات بحوث جديدة 
للمستقبل» تشمل: 

عقد مؤتمرات استرجاع النصوص. على فترات متباعدة» بحيث يتاح الوقت 
لهضم ما يتم الحصول عليه فعلاً من نتائج. 
تركيز الجهد على مهام أو مسارات أقلء من أجل مواصلتها بمزيد 
من التعمق. ١‏ 
إدخال مستفيدين حقيقيين في المشروع, للارتفاع بمستوى قابلية نتائج 
البحوث للتطبيق. 
وضع تطبيق نتائج تجارب استرجاع المعلومات في الصدارة» ودفع مؤتمرات 
استرجاع النصوص على نحو أكثر حزما تجاه دراسات الاستر جاع في 
سياقات-عملية. 
اتباع مبج الصندوق الزجاجي الشفاف في التقييم» بإشراك الفرق كل على 
حدة. في الاستراتيجية أو الأداة المحددة» وربما أيضا على مستوى العامل 
المحدد؛ بدلا من اتباع نبج الصندوق الأسودء حيث تقارن النظم إجمالاً من 
حيث الأداء» عن طريق النتائج التي يحصل عليها كل فريق. 
الشروع في إجراء دراسات متعددة المهامء بتطبيق خبرة مؤتمرات استرجاع 
النصوص في هذه الدراسات. ومن شأن الاسترجاع أن تتم دراسته بوصفه أحد 
مكونات النظام؛ الذي يمكن أن يكفل أيضاً التلخيص الآلي للنصوص 
لقم نه عا سيل كال 
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كلمة أخبرة حول تقييم تنظيم المعلومات واسترجاعها: 

ترمز تجارب كرانفيلد» وسلسلة مؤتمرات استرجاع النصوصء للمشكلات 
والقضايا التي ينطوي عليها تقييم تنظيم المعلومات واسترجاعها. ويمكن القول 
بوجه عام؛ أن معظم مشروعات التقييم يتم تنفيذها في المختبرات» لا في مواقف ال حياة 
الحقيقية» وذلك بمجموعات اصطناعية» وطلبات مصنعة. وعادة ما يكون حجم 
المجموعة التجريبية صغيراء وإن كانت سلسلة مؤتمرات استرجاع النصوص تعد 
استثناءً. ويستخدم الاستدعاء والتحقيق» والتسرب 21811016 كمقاييس تقييم في 
غالب الأحيان. إلا أنه لا يمكن التعويل عليها؛ لأنها من بين المخاوف الأخرى. تقوم 
على أحكام ذاتية للصلاحية. وفضلاً عن ذلك» تركز معظم مشروعات التقييم على 
هذه المعايير كل على حدة (كالاستدعاء: والتحقيق» على سبيل المثال) في غياب إطار 
شامل لتقييم النظام برمته. والخلاصة: أننا نعلم ما يحدث في مثل هذه النظمء إلا أنه لا 
يتضح لنا تماماء ما يتعلق بأسباب حدوث ذلكء» وكيف يحدث. نظراً لنهج الصندوق 
الأسود للتقييم. 

وقد طرح الكثير من الأفكار والمقترحات» لدفع البحث في تقييم تنظيم 
المعلومات واسترجاعها قدماء بالخروج عن حدود النماذج القائمة» وتطبيق التعددية 
المنهجية؛ فقد وصف هارتر وهيرت (1997) 11611 820ق 1131161) على سبيل المثال» 
إطاراً ناشئاً لتقييم تنظيم المعلومات واسترجاعهاء يركز على استخدام الأبعاد والطرق 
المتعددة» والتقييم من منظور عدة مشاركين في أنشطة تنظيم المعلومات واسترجاعها. 
كما أنهما يؤمنان بقوة» بأن تفاعل المستفيد مع النظام ينبغي أن يوضع في الحسبانء أثناء 
عملية التقييم» في العصر الرقمي. ومن ناحية أخرى. فإن مشروعات التقييم المستقبلية 
ينبغي أن تتم في بيئة واقعية» وتستخدم مقاييس أخرىء خلاف الاستدعاء والتحقيق 
والتسربء وذلك للتغلب على وجهي القصور الأسوأ تأثيرأ في جهود التقييم السابقة 
في المجال؛ وهما الذاتية في الحكم على الصلاحية» وعدم القدرة على تحديد العدد 
الإجمالي للوثائق الصالحة في النظام. 
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الفصل الثاني عشر 
الذكاء الاصطناعي ني تنظيم المعلومات واسترجاعها 


الذكاء الاصطناعى (41) ععمعع !لاعاصا 301611 مجال هيدف إلى جعل 
الآلات قادرة على النهوض بمهام» يمكن أن تستلزم ذكاءًا» إذا ما نض بها البشر. 
وتبدي أوساط تنظيم المعلومات واسترجاعها اهتماما واضحا بيبحوث الذكاء 
الاصطناعي, أملا في استثار تطبيقاته في تنظيم المعلومات واسترجاعها. وعلى الرغم 
من تآلف البااحثين في الذكاء الاصطناعي» مع الإثارة والإحباط أيضاء في السعي 
لتحقيق أهدافهم» فإن حماسهم لم يفتر» وإنما على العكس» جرت أعداد متزايدة من 
المحاولات لتطوير تطبيقات الذكاء الاصطناعي. لأغراض تنظيم المعلومات 
واسترجاعهاء وخاصة منذ أصبحت العنكبوتية العالمية المنصة الرئيسة لتنظيم 
المعلومات واسترجاعها. ويلقي هذا الفصل نظرة شاملة على بحوث الذكاء 
الاصطناعيء في سياق تنظيم المعلومات واسترجاعها. ويحظى قطاعان نشطان 
لبحوث الذكاء الاصطناعي لأغراض تنظيم المعلومات واسترجاعها؛ وهما معالجة 
اللغة الطبيعية (7/1:8)» والعنكبوتية الدلالية- بالمناقشة» بالإضافة إلى أوجه قصور 
بحوث الذكاء الاصطناعي واحتالاته بالنسبة لتنظيم المعلومات واسترجاعها. 


نظرة عامة على بحوث الذكاء الاصطناعي: 

لقد استقر الذكاء الاصطناعي كمجال للبحثء منذ عام ١167‏ على الأقل» 
عندماعقدمؤّتثمر دارتٌهاوث ط2001:ة(1 (1991) كعصمل كت علء رمد 
2.262 ويهبدف الذكاء الاصطناعي لتطوير نظم تتصرف بذكاء, باستخدام 
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الحاسبات»؛ لإنجاز مهام تستلزم البرهان على أساس المعرفة الواعية. ويمكن أن تفسر 
المعرفة في الذكاء الاصطناعي بوصفها تجمعا من المعلومات والحقائق والقواعد 
المعتمدة؛ 5 إن مجرد الحدس والفطرة السليمة ©5685 35208زمء لا غنى عنهما 
بالنسبة للأنشطة الفكرية» كحل المشكلات. واتخاذ القرارات على سبيل المثال. والأهم 
من ذلك, أن الذكاء الاصطناعي من المفترض أن ينطوي على مكون أو عنصر قادر 
على البرهنة أو إقامة الحجة» ى] في مقدور البشرء في المواقف التي لا تتاح فيها سوى 
المعرفة الجزئية أو الارتباط غير المباشر؛ فنظام الذكاء الاصطناعي لأغراض تنظيم 
المعلومات» ينبغي أن يكون قادرا على إيجاد مصطلحات أوسع أو أضيق أو متصلة. 
تبعا لمحتوى الوثائق. وبعبارة أخرىء فإن النظام ينبغي أن يكون قادرا على التحقق من 
العلاقات بين المصطلحات التي تتضمنها الوثائق 00 هذه العلاقات. وينبغي 
للنظام أن يتمتع بذكاء اصطناعيء يحاكي الذكاء البشريء لكي ينجز المهمة. 

ويتم الحصول على المعرفة» في الذكاء الاصطناعي. عن طريق عملية هندسة 
المعرفة» التي يحصل فيها مهندس المعرفة على بغيته من خبير المجال» وهو إنسان واسع 
المعرفة إلى أبعد حدء في حقل أو مجال بعينه. وذلك اعتتمادا على طرق كالمقابلة» 
والملاحظة» وأساليب التفكير على نحو مسموع. ثم يتم تمثيل المعرفة المكتسبة أو 
التعبير عنها اعتمادا على قواعد الإنتاج”*' 5" 20011210959م أو الشبكات الدلالية؛ 
أو الأطرء على سبيل المثال لتشكيل قاعدة معرفية: وتشكل القاعدة المعرفية» إلى جانب 
التدابير الأخرى (كمحرك الاستدلال عستهص ععمعمع صل وإمكانية التعلم الذاتي» 
على سبيل المثال) أحد تطبيقات الذكاء الاصطناعي. 


(*) ناتج برنامج حاسبيء يستخدم عادة لتوفير شكل ما من الذكاء الاصطناعيء يتكون في المقام 
الأول من مجموعة من القواعد حول السلوك. وهذه القواعد تمئيل أساس ثبتت جدواه في 
التخطيط الآلي والنظم الخبيرة. (المترجم) 
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وقد تمت تجربة طرق مختلفة» في بحوث الذكاء الاصطناعي. في العقود الماضية. 
وقد أشار مولنز (2005) 34311185 إلى الأساليب التالية» القائمة على المعرفة» بالنسبة 
للذكاء الاصطناعيء عندما عاود النظر في موضوع الآلات القادرة على التفكير؛ وهي 
المنطق الرمزي» والشبكات العصبية الاصطاناعية؛ والاستدلال الافتراضى 
سولوء:زة8, والتصوير بالرنين المغناطيسي الوظيفي ©1/عمع128 لقموتاع صن 


(81151]) مداع هصر ا ععمقطموعء". 


والمنطق الرمزي نبج رياضي» يتم فيه التعبير عن الأفكار والمفاهيم؛ برموز 
كقواعد الإنتاج أو التسلسلات ا هرمية للمفاهيم. ثم تعالج هذه الرموز فيم| بعد. وفقا 
لقواعد المنطق. ونظرا لتوافر المعلومات الكافية؛ هناك أمل في أن تصبح نظم المنطق 
الرمزي هذه. ذكية في النهاية. وفي شرح أساليب التعلم الرمزي للآلات» وهي مكون 
لاغنى عنه في المنطق الرمزيء أشار تشن (1995) 0565 إلى أن التعلم من الأمثلة. 
وهو حالة خاصة للتعلم الاستقرائي 100101176 يبدو أكثر أساليب تعلم الآلات 
رمزياء محملا بالوعودء بالنسبة لاكتشاف المعرفة» أو تحليل البيانات؛ فالمستفيد على 
سبيل المثال» يسترجع مجموعة مبدئية من المقالات؛ ويقسمها إلى صالحة وغير صا حة 
بالنسبة 'لاهتمامه. ثم تستخدم هذه الأمثلة الإيجابية والسلبية بعد ذلك لتدريب النظام 
على التقاط الملامح المشتركة للمقالات الصاخة (1992 وتطعتعت8] يه عستسدعل). 

وتحاكي الشبكات العصبية الاصطناعية» في المستوى البدائيء الطريقة التي 
تعمل بها الخلايا العضبية في المخ؛ قهي تتكون من خلايا عصبية اصطناعية مترابطة» 
أي البرمجة التى تحاكى خواص الخلايا العصبية البيولوجية. وتحاكى الخوارزميات 
الوراثية 20118 عذاعمعع: وهي أحد أشكال تطور الشبكات ا الميراث 
الجينى والقدرة على استنباط حلؤل أفضل لمشكلة مافي كل جيل» بينا تكفل 
الكراررسات الارعاظية القدرة عل اكسحات الدزقة مويصاتت حلص تتيكات 
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الخلايا العصبية المترابطة (نقاط الارتكاز 208»5) ونقاط الاشتباك أو الارتباط 
العصبى 9381382565 الموزونة (الروابط 5ع1هة[) والوحدات المنطقية المبدئية. ومن 
المكن امشخلائ خوارزميات التعلم» لضبط أوزان الارتباط» بحيث يكون النظام 
قادرا على التنبؤ بالأمثلة غير المعروفة» أو تصنيفها على النحو الصحيح بهةع©)) 
(1995. واعتمادا على تصنيف المفاهيم القائم على الشبكات العصبية» على سبيل المثال» 
أعد تشن وآخرون (1994) .81 4© وهعط©. قائمة مبدئية بالأفكار والموضوعات 
المهمة» التي يتم التعبير عنها في تعليقات اللقاءات أو المؤتمرات. 

وقد أدت النظم التي تستخدم الأسلوب الرياضي المعروف باسم الاستدلال 
الافتراضيء إلى ارتفاع مستوى أداء كثير من برامج الذكاء الاصطناعيء إلى حد يكفل 
إمكانية الاعتماد عليها في العالم الواقعي. ومساعد مشبك ورق ميكروسوفت أوفيس 
أسقائتوكة رتك ««عمهم ع0152 1وموه0 311 أحد التطبيقات المعتمدة على نظم 
الاستدلال الافتراضيء على الرغم من أنه لم يلق استقبالا حسنا. ومن ناحية أخرى 
تبنى لاو وكويرا (2006) 001658 4هه ننهرة الأنموذج الافتراضيء للتنبؤ بتأثير 
البحث في العنكبوتية العالمية» على اتخاذ مجموعة من الأطباء للقرارات. 

والتصوير بالرنين المغناطيسي الوظيفي (101181) أسلوب يستخدم لمعرفة أي 
أجزاء المخ ينشط عندما يكون الشخص بصدد التفكير في ثيء محدد بعينه؛ فعندما 
يطلب من الأشخاص تخيل أداة (مطرقة على سبيل المثال) أو مبنى (منزل على سبيل 
المثال) فإن مناطق المخ نفسها هي التي تنشط على النحو الذي يمكن أن يحدث عند 
مشاهدة صورة لهذه الأشياء. ومن المفترض أن يكون بإمكان باحثي الذكاء 
الاصطناعيء تدريب برنامج للنظر في صور المخ» وأن يقرر بنسبة دقة 4١‏ بالمئة» ما إذا 
كان ذلك الشخص يفكر في أداة أو مبنى (2005 ,8/4131[385). ويمكن لمشل هذا 
البرنامج أن يقرأ في النهاية مخ الشخصء وبذلك يجعل بالإمكان التحقق من 
احتياجات البشر من المعلومات» على نحو أفضل وأكثر وضوحا أو صراحة. 
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وما لاشك فيه؛ أن هذه الطرق الأربع للبحث في الذكاء الاصطناعيء لا 
تشكل جميع الخيارات المتاحة. وما النهج اللغوي الذي يطبق على نطاق واسع. في 
معالجة اللغة الطبيعية» في الذكاء الاصطناعيء إلا أحد أمثلة هذه الخيارات. وبين| 
يتجاوز حدود مجال هذا الكتاب» تقديم دراسة تحليلية كاملة لطرق الذكاء 
الاصطناعيء فإنه يبدو أن باحثي الذكاء الاصطناعي. بصرفا النظر عن الأساليب 
المحددة التي يمكن لهم دراستهاء يتطلعون جميعا لتطوير تطبيقات لمجالات كثيرة 
(كالشخوص الآلية 50504105, والتحقبق من الأنهاط على سبيل المشال) وتنظيم 
المعلومات واسترجاعها أحد هذه المجالات. وقد بذلت جهود في مجال تنظيم 
المعلومات واسترجاعهاء لتطبيق الذكاء الاصدطناعي في اقتطاف أو اقتباس 
0+ المعلومات, والتلخيص الآلي» والرد على الاستفسارات» والبحث في 
اللغة الطبيعية» والوكلاء الأذكياء 286815 15161118684 فضلاً عن أمور أخرى. 
وتبدو معالجة اللغة الطبيعية والعنكبوتية الدلالية» همامجالا البحث ني 
الذكاء الاصطناعي اللذان يمكن أن يسهما على أحسن وجه. في مجال تنظيم 
المعلومات واسترجاعها. 


معالجة اللغة الطبيعية: 

معالحة اللغة الطبيعية مجال للبحث والتطبيق» يستكشف كيف يمكن لنصوص 
اللغة الطبيعية» التي يتم إدخاهها للحاسبء أن تعالج وتحول إلى شكل أكثر ملاءمة 
للمزيد من المعاللجة (1999 ,لقا 620750). وىا ذهب ليدي (1998) 1100 فإن 
معالحة اللغة الطبيعية» مجموعة من الأساليب الحاسبية الخاصة بتحليل وتثيل 
النصوصء التي ترد على نحو طبيعي» في مستوى واحد أو أكثر للتحصيل اللغوي؛ 
وذلك لأغراض تحقيق معالجحة للغة أشبه بالمعالجة البشرية» من أجل إنجاز مجموعة من 
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المهام أو التطبيقات المحددة. وتشمل هذه المهام أو التطبيقات في الأساس» التلخيص 
الآلي» والرد على الاستفسارات (2000 ,.1ه ؛© العه«هط:ة0). ونناقش هنا كلا 
من التطبيقين على حدة» بعد بيان دور معاجة اللغة الطبيعية في تنظيم 
المعلومات واسترجاعهاء 
دور معالجة اللغة الطبيعية في تنظيم المعلومات واسترجاعها: 

اللغة المنطوقة أو المكتوبة» مكون أساس في كل من تنظيم المعلومات 
واسترجاعها؛ نظرا لأن المعلومات ينبغي التعبير عنهاء عندما يتم تجهيزها ونقلها أو 
إيصاها. واللغة الطبيعية» في تنظيم المعلومات واسترجاعهاء في مقابل أي لغة 
اصطناعية أخرى» هي اللغة التي يمكن للبشر استعالها للتعبير عن المعلومات أو 
تمثيلهاء أو صياغة الاستفسارات. ومن الممكن معالجة اللغة الطبيعية في الذكاء 
الاصطناعيء في المستويات الصوتية» والصرفية» والمعجمية, والنظمية عناءهاه55؛ 
والدلالية» والحديث أو الخطاب 01560356. والوظيفية أو النفعية ,0092160©5) 
(1998 ,1100 :1986. ولكل هذه المستويات مضامينها بالنسبة لتنظيم 
المعلومات واسترجاعها. 

وينطوي المستوى الصوتي للتحليل على معالجة أصوات الكلام. ويمكن لهذا 
الضرب من المعالجة أن تكون له أهميته في استرجاع الأصوات (راجع 9/ 1/ ؟): 
الذي يشتملء على سبيل المثال» على المدخلات الصوتية أو المعلومات المنطوقة. 
وخاصية “شبه الصوت غ111 لاهو » في استرجاع المعلومات (كالعثور على سبيل 
المثال» على الوثائق التي تشتمل على مصطلحات لها جر شل ”الموسيقى ”). لا 
يمكن تنفيذها إلا على المستوى الصوت لمعالحة اللغة الطبيعية 8ئآ71ا. 
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ويتعلق المستوى الصرفي للمعالجة بالعناصر التي تستعمل لتكوين الكلمات 
المفردة» كجذوع الكلمات أو جذورهاء والسوابق» والحشوء واللواحق, والكلمات 
المركبة؛ فكلمة 131461518 على سبيل المثال» تتكون من السابقة 4هاتاء وجذر الكلمة 
11 . والبتر أسلوب للاسترجاع مشتق من هذا المستوى للمعاالجة. ومن الممكن 
لتنظيم المعلومات؛ كالتكشيف الآلي على سبيل المثال؛ أن يتم أيضاء وبدرجة معينة» 
عند معالجة الوثائق على المستوى الصرفي. 

وعادة ما تدل المع لجحة على المستوى المعجمي لم1 على مغزى الكليات 
واستعالحاء كتحديد ما إذا كانت كلمة 20016 على سبيل المشال» قد قصد بها كم في 
العمل المنشور أم كما في إجراء حجز. وتشمل المضامين بالنسبة لتنظيم المعلومات 
واسترجاعهاء في هذا المستوى للتحليل اللغوي: )١(‏ إزالة أو إزاحة كلمة الاستبعاد 
5600-8 (75) استبدال مصطلح البحث الآلي وإضافته (كالبحث في المكنز على 
سبيل المشال)؛ (”) اكتشاف الأخطاء الهجائية وتصحيحهاء (5) معالجة الأسماء 
الاستهلالية والمختصرات عن طريق عمليات البحث في قوائم المفردات. 

ويعرب المستوى النظّمي للتحليل الجمل؛ لتوضيح ما بين كلمات الجمل من 
علاقات نحوية؛ ما إذا كانت الوحدة البنيوية جملة أم عبارة أم فقرة» على سبيل المثال. 
وتنطوي هذه العملية أيضا على الحاجة إلى (النحوء الذي يصف الترتيبٌ المحتمل 
للكلمات ومختلف قواعد التوافق؛ فمن الممكن للعبارات الإسمية على سبيل المثشال» 
التي يتم التحقق منها في التحليل على المستوى النظّميء أن تكون مرشحة 
كمصطلحات للتكشيف. والبحث بالعبارات» والبحث بالتجاورء كل هذه تطبيقات 
للغة التي تعالج على المستوى النظّمي. 

وتحاول المعالجة على المستوى الدلالي إضفاء معنى على مختلف المكونات 
النظمية للجملة. ومن الممكن أن تدعو الحاجة إلى ختلف المساعدات الدلالية 
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(كالمكانز على سبيل المثال) لإجراء التحليل اللغوي في هذا المستوى. وتتكون عينة 
للتطبيقيات في هذا الصدد بالنسبة لتنظيم المعلومات واسترجاعهاء من العرض الآلي 
للإحالات»ء والمترادفات» والمصطلحات المتصلة. إلا أنه لا يمكن للمعا لجة على 
المستوى الدلالي» أن تتم بنجاح دون التحليل اللغوي على المستوى الوظيفي. 

ويفسر مستوى المخطاب 0156011356 لمعا مجة اللغة (الذي لم يذكرفي 
6 ,170521:05) المبنى والمعنى اللذين تحملهما النصوص الأكبر من الجملة. 
ويعتازة لزي فزئه يمع لد مله المناحة أن تكفل القدرة عل إيتضال المعدى على 
نحو يتجاور أو يخرج عن نطاق ما يمكن إيصاله بالكلمات أو الجمل المفردة. ويمكن 
للغة الطبيعية» التي تعالج على مستوى الخطابء أن تستعمل لفهم الدور المحدد لكل 
عنصر من عناصر المعلومات في الوثيقة؛ ما إذا كان» على سبيل المثال» خلاصة:؛ أو 
وجهة نظرء أو تنبؤ أو حقيقة ببساطة. ومن الواضح أن هذا البنيان مضامينه المحددة 
بالنسبة لاسترجاع المقاطع أو الفقرات ©95588م؛ نظرا لأن المقطع في هذا السياق.» 
يمكن أن يكون أطول من الجملة. 

ويحاول المستوى الوظيفي 2241م أعلى مستويات معالجة اللغة» تحديد 
معنى اللغة على ضوء السياق المحيط؛ والمؤلف. والمستفيد. والإحاطة بالعالم الواقعي. 
ويمثل هذا المستوى من المعالجة أكبر تحب لباحثي الذكاء الاصطناعيء في معالجة اللغة 
الطبيعية. فالبشر يعتمدون فعلا علق السياق والمعارف الأخرى لفهم اللغة والتتخلص 
من الغموض. إلا أن ما تنطوي عليه هذه العملية من تعقد وصعوبة؛ لم يتم استيعابه 
كاملا بعد ولم تتطور النظم القادرة على تحاكاة كيفية معالجة البشر للغة في هذا 
المستوى. ويمكن لتطبيق هذه العملية في تنظيم المعلومات واسترجاعهاء أن يكون أمرا 
غير عادي؛ وعلى قدر هائل من الأهمية؛ إذا ما أمكن تحقيق اختراق في معالجة اللغة 
الطبيعية» في هذا المستوى. ويمكن لكثير من التطبيقات التي كانت تراود الأحلام» في 
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تنظيم المعلومات واسترجاعهاء كالتلخيص الآلي» والاستفسار باللغة الطبيعية, أن 
تصبح حينئذ حقيقة واقعة. كذلك يمكن لتبديل اللغات قصتطء)51 إتدة[ساطهقعءوى, 
الذي عرضنا له بإيجاز في نهاية الفصل الرابع» كوسيلة للانتقال تلقائياء من إحدى 
لغات تنظيم المعلومات واسترجاعها إلى أخرىء عبر مجاللات موضوعية مختلفة» أن 
يفيد أيضا من اتجاه البحث هذا في الذكاء الاصطناعي. 

وإذا ما أمكن إنجاز معالجة اللغة بنجاح على المستوى الدلالي والوظيفي 
والخطاب. فإنه يمكن للعنكبوتية الدلالية التي تصورها تيم بيرنرز-لي 112 
ع6.آ-و«عم»8 ورفاقه؛ أن تصبح حقيقة واقعة. ونستكشف موضوع العتكبوتية 
الدلالية في القسم /١7‏ "”. ومن ناحية أخرى, تحدد المستويات السبعة المختلفة التي 
تنطوي عليها معالجة اللغة الطبيعية» معالم ما يمكن لمعالجة اللغة الطبيعية أن تحققه 
بالنسبة لتنظيم المعلومات واسترجاعها. وكلما ازدادت وحدة التحليل حجما (أي من 
المورفيم ع اعوط أي أصغر وحدة صرفية» إلى الكلمة» ثم الجملة» ثم الفقرة» 
إلى الوثيقة الكاملة) تتراجع دقة الظواهر اللغوية» ويزداد الخيار الحر والقابلية للتغير. 
وبينما يمكن إنجاز المستويات الأربعة الأولى للمعالجة» على نحو معقول في أيامنا هذه» 
فإن الحاجة تدعو لإجراء المزيد من البحوث في إتمام التتحليل اللغوي على المستوى 
الدلالي» ومستوى الخطاب» وخصوصا المستوى الوظيفي. ويمكن لجهود البحث في 
علم اللغة الحاسبي» واللغويات بوجه عامء وفلسفة اللغة» وعلم اللغة الاجتماعي» أن 
تيسر بحوث الذكاء الاصطناعيء في معالجة اللغة الطبيعية 8 عصمءعمع0)) 
(1984 بيقللهن)اء11. 


ونظرا لأهمية اللغة في تنظيم المعلومات واسترجاعها؛ فإن مضامين معالجة 
اللغة الطبيعية بالنسبة لتنظيم المعلومات واسترجاعهاء تبدو واسعة المدى. ويشكل 
التلخيص الآلي» والرد على الاستفسارات (04) المجالين التطبيقيين الرئيسين في هذه 
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الفئة (2000 ,.81 © ,[اعدهط:68). بينا يمكن النظر إلى التطبيقات الأخرى 
(كاقتطاف المعلومات أو اقتباسهاء والبحث في اللغة الطبيعية» على سبيل المثال)؛ 
بوصفها امتدادا لما ينطوي عليه التطبيقان الرئيسان أو اشتقاقاً منهما. ونناقش في أقسام 
لاحقة:؛ التلخيص الآلي والرد على الاستفسارات» ونتبعهه بتطبيقات الذكاء 
الاصطناعي الأخرى في مجال تنظيم المعلومات واسترجاعها. 
التلخيص الآلي: 

التلخيص الآلي هو إعداد طبعة موجزة من نص ماء بأحد برامج الحاسب. 
وترجع جهود البحث في هذا الصدد. إلى خمسينيات القرن العشرين» حين]| كان هانز 
بيتر لون سطنرآ «عاء5 كصوآ8 يجري تجاربه على إعداد المستخلصات آليا (1958). 
ولما كانت المعلومات في العصر الرقمي» تنمو بمعدلات أسية وتضل إلئ مستوئ 
بيتا ه261 (أي ٠١‏ ") في وقت قصير جدا (2008 ,[آم6850): استخدمت طرق 
مختلفة» كالتلخيص الآلي على سبيل ال مشالء للتعامل مع سيول البيانات الجارفة. 
والتلخيص الآلي» الذي يبدو في سبيله في الواقع لأن يصبح قطاعا في حد ذاته. في مجال 
تنظيم المعلومات واسترجاعهاء نظام ييدف على وجه التحديد, لإنتتاج ملخصات» 
باستعال تقنيات معالحة اللغة الطبيعية. 

وللتلخيص في هذا السياق معنيان؛ أولما الاقتطاف أو الاقتباس همناء758]<©. 
وثانيه| الاستخلاص 855181108» وإن كان ينبغي الإشارة إلى أن هذا الأخير ليس 
هو نفسه المستخلص التقليدي» الذي عالحناه في 7/7 2.١/1١‏ فى) ذهب ماني . نمه]/1 
(2001)» فإن الاقتباس ملخص يتكون برمته» من مواد مستنسخة من المصدر الذي 
يتم إدخاله؛ بينه) المستخلص ملخص يشتمل على الأقل» على بعض العناصر التي لم 
يكن لها وجود في الأصل الذي تم إدخاله. وتشمل المحددات الأخرى للتلخيص 
لآل معدل الضغط أو التركيز 6وأووع375م» (أي نسبة طول الملخص إلى طول 
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المصدر الأصلي)» والمتلقي (أي ما إذا كان عاما أم مركزا في اهتتاماته)» وحجم المصدر 
(أي ما إذا كان وثيقة واحدة أم عدة وثائق)» والجنس الأدبي 8886 (كالأخبارء أو 
رسمائل البريد الإلكتروني» أو رسائل المدونات» أو صفحات العنكبوتية)» واللغة (أي 
ما إذا كان أحادي اللغة» أم متعدد اللغات, أم عبر اللغات) والوسائط (كالنبصوصء» 
والأصوات» والصورء والفيديو). وعادة ما تصنف الملخصات وفقا لهذه المحددات؛ 
فالملخصات التي تنشأ للجمهور العام؛ على سبيل المثال» تسمى الملخصات العامة. 


عملية التلخيص الآلي: 

كما يمكن أن يتبين لنا من قائمة المحددات التي سبق ذكرهاء فإن بعض أنواع 
الملخصات الآلية (كتلك الخاصة بالوثائق المفردة على سبيل المثال) أيسر في الحصول 
عليهاء من الأنواع الأخرى (كتلك الخاصة بالوثائق المتعددة على سبيل المثال). 
وتنطوي عملية التلخيص الآلي» بوجه عام على الخطوات الرئيسة التالية: التتحقق من 
الجملة واختيارهاء واقتطاف الجملة» وعمليات صقل 28ذط)57200 الملخص. وفي 
الوقت الذي لا يمكن فيه الاستغتاء عن الخطوتين الأوليين بالنسبة لأي تلخيص آلي؛ 
فإن عمليات صقل الملخص,قد لا يتم إنجازها؛ نظرا لأن معظم حالات التلخيص 
الآلي تتم بمجرد ترتيب الجملء بدلا من صقل الملخص في هذه الخطوة. ولاتتم 
عمليات الصقل الحقيقية للملخصء أي جعل الملخص أكثر قابلية للقراءة» لا تتم إلا 
عندما يكون الناتج النهائي مستخلصا (2001 ,نههكاة). وبإمكان النظم الراهنة 
للتلخيص الآليء بوجه عام إعداد مقتطفات أو اقتباسات لا مستخلصات ,7ع09) 
(2007 وكعتمل عاعتتقم5 :2007 مسقدصمد]؟ ين وصدط. ومن بين الخطوات الثلاث 
التي تم التحقق منها في عملية التلخيص الآلي» يعد التحقق من الجملة واختيارها 
الأهم والأصعب. في حين يتم اقتطاف الجملة آليا في المقام الأول» ولا يتم صقل 
الملخص إلا بالنسبة للمستخلصات فقط؛ ومن ثم فإن أنموذج تجهيز الملخص 
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التخطيطي 56502016 للنصء الذي عرضته سبارك جونز وعصمل عاععقمه 
(2007). في الشكل رقم )١(‏ في تقريرهاء يبدو أكشر ملاءمة بالنسبة لإنتاج 
المستخلصات. والأمر كذلك أيضا بالنسبة للهندسة المعمارية عناءعاقطءع5ة 
للملخص رفيع المستوى, الذي صوره ماني (2001) 4صه]لا. 


المقاربات الرئيسة للتلخيص الآلبي: 

كما هو الحال بالنسبة لأنشطة تنظيم المعلومات واسترجاعها الأخرى» هناك 
مقاربات أو مناهج مختلفة للتلخيص الآلي. وقد قسمت سبارك جونز عاءمقمة» 
(2007) وعدول هذه المقاربات إلى اقتباسية ©548©]19© في مقابل غير الاقتباسية» 
وذلك بناء على ما إذا كان الناتج النهائي اقتباسا. ثم تحققت بعد ذلك من ثلاث فئات 
فرعية للمقاربات الاقتباسية؛ هي الإحصائية الأساسية: والإحصائية المدعمة 
0 معو تعلم الآلات عسنتصمة»ء1 عستطعومط. وتدل الطرق الإحصائية 
الأساسية للتلخيص الآلي» على استعمال تردد المصطلحات 1# والتردد العكسي 
للوثائق 184 و(راجع /١/5‏ 27/7 أو خوارزميات الوزن الأخرئ. للترتيب الطبقي 
للجمل المصدرية. ويتم اختيار الجمل من القائمة الطبقية لأعلى الأرصدة مه 
5 » حتى الوصول إلى الحد الفاصل 1516512010 لطول الملخص (كأن يكون ٠١‏ 
بالمئة من طول المصدر على سبيل المثال). وعادة ما يتم إيصال الجمل التي يقع عليها 
الاختيار» بالترتيب نفسه. الذي وردت به في المصدر الأصلي. وتشمل أوجه قصور 
مثل هذه الملخصات. ترتيب الجمل كما هي في المصدرء وتحديد وضعها الطبقي بناء 
على خوارزميات قائمة على التردد فقط. . 

والمقاربات الإحصائية المدعمة» مصممة إلى حد ماء للتغلب على أوجه قصور 
الطرق الإحصائية الأساسية. ويتم تدعيم هذه الأنواع من الاستزاتيجيات» عن طريق 
الوحدات والخواص المعجمية؛ أو من خلال بنيان المصدر. وفي الطريقة الأولى 
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للتدعيم؛ يتم إجراء معالجة معقدة للعناصر المعجمية» التي يتم حساب إحصاءاتها. 
وتشمل هذه المعالجة كلا من أنواع الوحدات التي يقع عليها الاختيار (كالكلمات 
المتصاحبة 60-970505: أو مجموعات الكلمات) والوزن التفاضلي لأنواع الوحدات. 
كذلك يتم أيضا التحقق من العناصر المعجمية المحددة ذات الخصائص التي تدل على 
الأغمية (كالخلاصات على سبيل المثال)» والكيانات الفريدة لمصادر العنكبوتية 
(كالروابط والمحددات الموحدة لأماكن المصادر 171815 على سبيل المثال) في عملية 
التلخيص. وفي مقابل ذلك تعتمد الطريقة الأخرى للتدعيم؛ على الاستخدام المكئتف 
لبنيان المصدرء وذلك بالخروج عن حدود الجمل» ومراعاة معلومات من قبيل بنية 
الخطاب على سبيل المثال. 

ويمثل تعلم الآلات الفئة الفرعية الثالشة للمقاربات الاقتباسية للتلخيص 
اللي فمن المفترض في التلخيصء إذا ما تم على النحو الصحيح, أن يكون تعبيرا عم| 
يحدد مواصفات المصدر. ومن ثم فإنه من الطبيعي التحقق مما إذا كان التلخيص عن 
طريق تعلم الآلات» يمكن أن ينتقي الملامح المناسبة للمصدرء با في ذلك أوزان 
الملامح» ومجموعات الملامح» من بين مجموعة الخيارات المحتملة. ويمكن لتعلم 
الآلات» وهو أسلوب غالبا ما يطبق في بحوث الذكاء الاصطناعي - يمكن أن ينقسم 
إلى التعلم المراقب 6571560ماق5. والتعلم غير المراقب. ويكون التعلم مراقبا إذا ما 
كان الأمر يتطلب تدخلا ما (كتوفير أمثلة التدريب) من جانب المستفيد» من أجل 
عملية التعلم (2006 ,721213) 2 متاععش ,10نتن'1). وكان الباحثون في)| مضى 
يستخدمون تعلم الآلاتء في التلخيص الاقتبامي لتؤجيه الاقتباسء والتحقق من 
علاقات الخطاب,. وترتيب الجمل المقتبسة» وغير ذلك (2007 وقعصول عاء فم 8). 


وعلى عكس الطرق الاقتباسية التي سبقت مناقشتهاء فإن الطرق غير 
الاقتباسية قد تطورت لإعداد مستخلصات في التلخيص الآلي. وينبغي أن تكون مثل 
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هذه المستخلصاتء التي يفترض أن تمثل النص المصدريء با لا يتجاوز حدود 
العناصر المعجمية المفردة» تعبيراً أقضل عن المصدر. إلا أنه لم يكن هناك سوى قدر 
ضئيل نسبيا من التلخيص غير الاقتباسيى في العقد الماضي (2007 وقعصمل علقم 5). 
الأمر الذي يدل بدوره إلى حد ماء على ندرة الأساليب المجدية الناجحة:؛ لإنتاج 
ملخصات غير اقتباسية. وفضلا عن ذلك. عادة ما ينطوي ما يتم إنتاجه في هذه الفئة 
من الملخصات. على درجة ما من إعادة صياغة للمحتوى المصدري (2001 ,1مة81) 
وليس تمثيلا موجزا لهذا المحتوى. 1 

ومن منظور المعالجة اللغوية» قسم ماني (2001) 1884 مقاربات التلخيص 
على نحو يختلف عرا ذهبت إليه سبارك جونز (2007) 10065 عكقم8: على الرغم 
من أن هناك أيضا ثلاثة أنواع من الطرق أو المقاربات؛ وهي المقاربات السطحية 
9211017 والمقاربات المتعمقة» والمقاربات الحجين. ولا تحاول المقاربات الضحلة أو 
السطحية للتلخيصء الخروج عن حدود المستوى النظّمي لمعالجحة اللغة الطبيعية» بين| 
تتكفل المقاربات المتعمقة» بوجه عام بالمستوى الدلالي للجملة على الأقل؛ والمقاريات 
المتعمقة للتلخيص الآلي أكثر صعوبة من المقاربات السطحية في التطبيق» نظرا للوضع 
الراهن للمعرفة في تقنيات معالجة اللغة الطبيعية. وتسمى المقاربة الثالشة للتلخيص» 
التي حددها ماني (2001) 8/851 بالطريقة الهجين, وتنطوي على قدر كبير من إعادة 
ترتيب النص» على نحو يشمل تغيير العلاقات المعتمدة على الخطاب» كجزء من 
عمليات صقل الملخص. وكيا سبق أن بينا فإن عمليات صقل الملخصء لا تتم بانتظام 
أثناء التلخيص» ويرجع ذلك إلى حد ماء إلى أن التقنيات الخاصة بمثل هذه العمليات 
لاتزال في مرحلة التطوير. 
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تقييم التلخيص الآلي: 

لمم كان التقييم أمراً لا غنى عنه للارتفاع بمستوى جهود تنظيم المعلومات 
واسترجاعهاء فإن مؤتمرفهم الوثائق عمتلمماكمء0ه] أمعصصسبهم1 
ع20011©1) (154.507ه.101700:011)؛ وهو برنامجء يشبه سلسلة مؤتمرات 
استرجاع النصوص 567165 118180 من أوجه كثيرة» فيهما عدا تركيز مؤتّمر فهم 
الوثائق» الذي يعقد منذ عام »5٠١ ١‏ على تلخيص النصوص. وقد نظر أوفر ودانج 
وهارمان (2007) طقدط:212 عت عصهد(آ ,095)» بعمق في عمليات التقييم» التي عت 
في مؤتمر فهم الوثائق» من عام 0٠‏ حتى عام ٠٠١”‏ 2001-2006 21000 إلى 
جانب الأنشطة الماثلة» التي تتم في مؤتمر تقييم التلخيص 71220108قتسصسناك 
(11140نآ5) ععمدع مع هون ممولمهد 891 وإن يي سى آي آر 28100112 (إن آي 
آي مجموعة الاختبار لنظم استرجاع المعلومات 118 7 موناء»011) أوع1 2/11 
كنقاع ]6 ). وقد استخدم نوعان رئيسان من التقييم في هذين المؤتمرين» من أجل 
اختبار المللخصات؛ وهما التقييم الجوهري أو المتعمق عأوصةةاسف والتقييم السطحي 
©51تلة:». ويركز التقيبم الجوهري على وجه التحديد؛ على قياس جودة المللخصات 
الناشئة مباشرة» بين) يركز التقييم السطحي على قياس مدى نجاح الملخصات في دعم 
الأداء في مهام معينة. وموضوع مؤتمر فهم الوثائق 110 هو تلخيص النصوص الذي 
يشمل التلخيص الآلي» ولكنه يشمل أيضا الطرق اليدوية في العمل. وبالإضافة إلى 
الكشف عن أن الملخصات الآلية الناشئة في مؤتمر فهم الوشائق من عام ٠٠١١‏ إلى 
27 مقتطفات في المقام الأول» سجل أوفر ودانج وهارمان © عضصة182 ,ع0 
(2007) 3213تتول النتائج التالية: 


٠‏ معظم الملخصات اليدوية أفضل ولاشك من معظم الملخصات الآلية. 


٠‏ لا تختلف معظم الملخصات الآلية اختلافا جوهريا عن بعضها البعض. 
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« عادة ما تختلف الملخصات الآلية في حدودها القصوى. اختلافا جوهريا فيا 
« .نادرا ما يكون أداء الملخصات الآلية أفضل من الحدود الدنيا (أي التقاط 
الجمل أو الفقرات الافتتاحية) اعتمادا على بنية المقالات الإخبارية. 

وفضلا عن ذلكء اقترح أوفر ودائج وهارمان سقدمئة]8 عه صق 0 
(2007) ضرورة انتقال مؤتمرات فهم الوثائق ©2]7 المستقبلية» لا إلى ما يتتجاوز المواد 
الإخبارية فحسبء وإنا إلى مهام التلخيص الجديدة» التي توحي بها أوجه الإفادة 
الحقيقية من الملخصات (كالملخصات في مجالات بعينها كالطب والقانون على 
سبيل المثال). 

وقدتطؤرمؤتمر تحليل النصوص ©5©6ءتمعكم00) 9915[همة )1 
(©هاانا0ع مأكتص. 0,7 14)» الذي بدأعام8١٠٠,.عن‏ مؤتمر فهم الوثائق» 
ومسار الرد على الاستفسارات (04) بمؤتمرات استرجاع النصوص 11410. 
ويهدف مؤتمر تحليل النصوص إلى مساندة البحث,. في نطاق أوساط معالجة اللغة 
الطبيعية» وذلك بتوفير البنية الأساس اللازمة للتقييم واسع المدى» للمناهج الخاصة 
بمعالجة اللغة الطبيعية. وبرعاية المعهد الوطني للمواصفات المعيارية والتقنية 30151 
وغيره من الأجهزة الحكومية الأمريكية» يحل مؤتمر تحليل النصوص محل مؤتر فهم 
الوثائق ق في الأساسء بينا ينهض بأدوار أخرى (كتقييم الرد على الاستفسارات على 
سبيل المثال) في مجال معالحة اللغة الطبيعية. 

ويمكن للتلخيص الآللي أن يكون أي شيء إلا أن يكون موضوعا بسيطاء نظرا 
لتعدد أبعاده (2000 ..31 أء لاعصهط50 2ن )). وتسهم المتغيرات التي تناوها ماني قصد]/1 
(2001) (كمعدل الضغط أو التركيزء والمتلقي» وحجم المصدر والجنس الأدبي» 
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ونوع الملخص) جميعها في هذا التعدد في الأبعاد» الذي يدل في النهاية على ما يكتنف 
التلخيص الآلي من صعوبة وتعقد. ومن ناحية أخرى فإن البحث في التلخيص يتسع 
مداهء ك| يحرز التقدم (2006 ,عطن) يق 2461208314 على سبيل المثال). ويمكن 
للإنجازات المستقبلية في التلخيص الآلي» أن تيسر إلى حد بعيدء الكثير من أنشطة 
تنظيم المعلومات واسترجاعها. 
الرد على الاستفسارات: 

يمكن لكل من يجري عملية بحث,ء اعتمادا على نظام للاسترجاع (كأن يكون 
نظاما على الخط المباشر» أو فهرسا متاحا على المخط المباشرء أو البحث بأحد محركبات 
البحث في العنكبوتية) أن يتلقى بعض النتائج في المقابل. ويمكن لمثل هذه النتائج أن 
تشتمل على الإجابة التي يلتمسها المرء أو لا تشتملء وعلى المستفيد أن يتصفح النتائج. 
وبعبارة أخرىء فإن نظام استرجاع المعلومات, لا يمكنه سوى الحصول على بعض 
النتائج» وعرضها للمستفيدء بين| يتعين على المستفيد أن يمعن النظر في النتائج» للعثور 
على الإجابة إذا كانت هناك فعلا. ومهمة المستفيد في العثور على الإجابة من النتائج 
المسترجعة» ليست هينة؛ لأسباب متعددة (كالوقت,. والحكم على الصلاحية» 
والمصادر التي لا يمكن الوصول إليهاء والمجموعات). ومن ثم فقد اقترحت تقنية 
الرد على الاستفساراتء لإعفاء المستفيد من عبء غربلة الإجابة من نتائج عملية 
البحث. التي غالبا ما تعد بالملايين في العصر الرقمي. 

ويعني الرد على الاستفسارات» بإيجاز أن نظام استرجاع المعلومات قادر على 
تقديم الإجابة للمستفيد على وجه التحديد» وذلك في نتائج عملية البحث» بدون أي 
معلومات غير صالحة» تختلط مبذه الإجابة. وقدقدم مايبري (2004) لإعناط:زة1/ 
تعرايفا أكثر شمولا للرد على الاستفسارات 0#: 
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الرد على الاستفسارات (04) عملية تفاعلية بين الإنسان 
والحاسب» تشمل إدراك جاجة المستفيد إلى المعلومات» التى عادة 
ما يتم الإعراب عنها باستفسار باللغة الطبيعية» ثم استرجاع 
الوثائق أو البيانات» أو المعرفة» من مصادر منتقاة» واقتطاف 
وتبيئة وترتيب أولويات الإجابات المتوافرة من هذه المصادر» ثم 
عرض الاستجابات» وشرحها بطريقة فعالة. (3.©) 
عملية الرد على الاستفسارات: 
في الوقت. الذي يبدو فيه مفهوم الرد على الاستفسارات جاذبا إلى أبعد حد؛ 
فإن تحقيق هذا اهدق ينظوي على تحديات في جميع خطوات العملية. وعادة ما يتناول 
الباحثون في المجال» كيف يتم الرد على الاستفسارات من منظور معارفهم وخبراتهم 
زر اجع على سبيل المثال وتاهكآ © صاط :2001 ,710 عت أصمنتساكا ركاه كا 
6 وعادة ما يشتمل أسلوب الرد على الاستفسارات» بوجه عام؛ على إعراب 
الاستفسارات أو تحليلهاء وتصنيف السؤالء وصياغة الاستفسار, واقتطاف الإجابة» 
واختيار الإجابة» وعرضها. 
والخطوة الأولى في عملية الرد على الاستفسارات هي إعراب الاستفسارء أو 
تحليل الاستفسار لفهم السؤال الذي يثيره. وإذا ما كان نظام استرجاع المعلومات 
يدعم البحث في اللغة الطبيعية (راجع /١7‏ 7/ 5)» فإن هذه الخطوة عادة ما تعالج 
بواسطة تقنية مدمجة ه(-غلأناط. وما لم يكن الأمر كذلك» فإن الاستفسار الذي يتم 
إدخاله في صندوق البحث الخاص بنظام استرجاع'المعلومات» ينبغي أن يتم تحليله 
قبل أن يكون بالإمكان انتقاله إلى الخطوة التالية في الرد على الاستفسارات. 
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ويمكن للخطوة التالية أن تكون تصنيف السؤال وفقا لإطار ما. وقد بنيت أطر 
غذائه لجخي لأجعرة عر هنا لدو فل در انين قل مكف كارنوك زر ورفافقة 
(2000) ٠ه‏ ع ,العصوط:ة© كل هذه القضايا في أربعة مستويات (أي السائل 
العارض 850121©» والسائل المقولب أو النمطي ع)2[متمع). والمرسل المبتدئ طاتك 
6ه وتلل المعلومات المحترف)» وذلك في الوقت الذي درس فيه بومرانتس 
(2005) قاصة:عصوط خمسة تقسيمات رئيسة للأسئلة (أي أطر لتصنيف الأسئلة) في 
الرد على الاستفسارات: 

.١‏ أحرف دبليو 798 الستة 755 6ز8 (أي من 0ط وماذا 7984 ومتى 
اعط؟, وأين »عط وكيف 8077): وينتمي كثير من أسئلة هذا الإطار 
للفئة الحقائقية 58©381؛ أو 586014 ويبدو تصنيفها على العموم مباشرا. 
وتشمل أمثلة أسئلة هذا النوع» متى ولد جورج واشنطن؟ وما أعلى مبنى في 
العال/؟ 

. موضوعات الأسئلة: تصنف الأسئلة في هذا الإطار باستعمال لغات مقننة 
معينة (مثل تصنيف مكتبة الكونجرسء ومكنز الفنون والعمارة). ويمكن 
تصنيف هذه الأسئلة وفقا لمحتواها ا موضوعي. ويمكن لعينة من هذه 
الأسئلة أن تكون: ما أكثر طرق التدريس فعالية في التعليم الجامعي؟ ‏ << 

". أوجه الإفادة من الإجابات المتوقعة: وتصنف الأسئلة في هذا الإطار» بالنظر 
في وظائف الإجابات المتوقعة أو أوجه الإفادة منها. فهل يمكنء على سبيل 
المثال» لإجابة للسؤال أن تستعمل لأغراض المقارنة أو التفسير؟ وقد وضع 
بومرانتس (1 1816 ,2005) ماطهجم20 تقسي] لأوجه الإفادة من 
الإجابات المتوقعة. 
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5. أشكال الإجابات المتوقعة: ويبدو هذا النهج في التصنيف مماثلا للطريقة 
الكني عادة ما تصنف بها الأسئلة المرجعية التقليدية (كالإرشادية 
لقدمناءء15. والمرجعية الجاهزة على سبيل المثال). كذلك جمع بومرانتس 
(2 عاطه] ,2005) تاصةععصرومط الأشكال أو الصيغ المألوفة للإجابات 
المتوقعة. 

. أنواع المصادر: تصنف الأسئلة في هذا الإطار وفقا لأنواع 5»م/© (أو 
أجناس) المصأدر التي يمكن أن يتم منها اإستقاء الإجابات. إلا أن هذا 
التصنيف لم يطبق لتصنيف الأسئلة في عملية الرد على الاستفسارات 
(2005 و2)ظة"اعدمه2). وتشمل عينة المصادر كلا من المستخلصات» 
والكشافات» والمعاجمء والموسوعات, والكتب السنوية أو الحوليات. 


وعلى غرار النوع الثالث للتصنيف؛ لخص بومرانتس (2005) تتاصةتعسدوط. 
خطة تصنف فيها الأسئلة؛ بناء على الطريقة التي يمكن بها للسائل (أي المستفيد) أن 
يفيد من الإجابة التي يسترجعها نظام الرد على الاستفسارات. وقدم كاربونل ورفاقه 
(2000) .21 ع ,لاعصوط»هن) هذه الخطة. وعادة ما يوجه السائل العارض أسئلة 
بسيطة وحقائقية. إلا أن السائل النمطي أو المقولب عادة ما يطرح أسئلة يمكن 
معالجتها بقوالب معيارية» يمكن فيها العثور على أنواع معينة من المعلومات. وتشمل 
أمثلة هذه الأسئلة: ماذا نعرف عن شركة 41300؟: وما قصة حياة الممثل س؟ ويمكن 
لإجابات الأسئلة النمطية هذه أن تكون أصعب بالنسبة لنظام الرد على الاستفسارات 
في العثور عليهاء ما هو عليه الخال بالنسبة للسائل العارض؛ نظرا لآنه غالبا ما يتطعلب 
الأمر استرجاعها من مصادر متعددة. وتسمى الفئة الثالثة من يوجهون الأسكلة 
بالمراسل المبتدئ 0م76 طانك. وقد اختير الاسم ببساطة بوصفه ضربا من التناظر 
(2000 ..1ة أء ,العصوطهن))؛ فالمراسل المتتدئ يركز على العثور على البيانات 
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الحقاكقية» إلا أنه ببحاجة أيضا لأن يجمع معلومات من مصادر متنوعة. وفضلا عن 
ذلك» فإنه ليس هناك قالب معياري متاح في هذه الحالة؛ نظرا لأن بعض المعلومات 
التي يببحث عنها المستفيد» يمكن أن تكون جوهرية بالنسبة لجاجته بين| تكون البقية 
هامشية في أحسن الأحوال. وغلى نظام الرد على الاستفسارات أن يحدد ما ينبغي 
استرجاعه. اعتمادا على الأساليب المناسبة. وتسمى الفئة الأخيرة في هذه الخطة. 
لتصنيف مقدمى الأسثلة بمحلل المعلومات المحترفء ؤتمثل أنواعا مختلفة من 
المستفيدين» على الطرف الأعلى لطيف الرد على الاستفسارات؛ فه و لاء المستفيدون» 
كفئة بحاجة إلى إجابات لأسئلة متطورة» على الرغم من أنهم يعملون في مهن مختلفة 
(ككبار مراسلي الأخبار» والعلماء العاملين على حل المشكلات المتقدمة» والضباط 
الذين يحللون الاستخبارات على الصعيد الوطني). وغالبا ما يكون الأمر مهمة شاقة» 
بالنسبة لتطوير نظم الرد على الاستفسارات هذه الفئة من المستفيدين. 

وأيا كان الإطار المستخدم تصني لعل فاه هذا الإجراء ينبغي اتخاذه قبل 
الخطوة التالية في الرد على الاستفسارات» وهي صياغة الاستفسار؛ وذلك لضهان 
تنفيذ الخنطوات التالية بناء على ذلك؟ فمن الممكن» على 006 المثال» للعمليات 
الخاصة بالحصول على إجابة لسؤال حقائة ثقي» أن تختلف عن تلك الخاصة بالإجابة عن 
مالا فوشو بجوو لاتقل ىن وما قله لودع | و نالعو ان 
الاستفسار الذي يقدم من جانب المستفيد» يتم تحويله فعلا باستعال قواعد النظم 
18 والتفصيلاات الأخرى التي يدعمها نظام الرد على الاستفسارات» حتى 
يمكن معالحته بواسطة محرك ببحث النظام على النحو المناسب الصحيح. كذلك يمكن 
تطبيق إجراءات كتحويل الفعل» وتلقيم الصلاحية المرتد» وصياغة العبارة الاسمية» 
وذلك عتد إعادة صياغة الاستفسار لأغراض الرد على الاستفسارات عت على 
سبيل المثال 2001 م5561 © نمهنناظ1 باه162). 
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والخطوة الرابعة في الرد على الاستفسارات هي استخلاص الإجابة» التي 
تستقطب بالفعل معلومات معينة من المصادر» وفقا لبعض القواعد. ووراء هذه 
الخطوة اقتطاف المعلومات (117). ويمكن للمصادر المستخدمة في عملية اقتطاف 
المعلومات أن تكون مجموعات يتم بناؤها خصيصا (راجع على سبيل المثال يت 1.18 
6 ,2 1) أو مجرد ما هو متوافر على العنكبوتية (راجع على سبيل المشال 
4 ,ناا عت «اسقددتاء20). وتعرف القواعد التي يتم الاسترشاد بها في الاقتطاف 
بالأغلفة 5تعم مه التي تصمم عادة لمصدر معلومات بعينه © 08) 
(2006 ,كله987812. ويتم إنشاء الأغلفة» عن طريق الجمع بين تقنيات معالجة اللغة * 
الطبيعية» وتعلم الآللات» والنمذجة الإحصائية» والإلمام بالمجال (راجع على سبيل 
المثال 2004 ..1 © ,1125©8). وبمساعدة مثل هذه الأغلفة.» يتم التحقق من 
المحتويات الرئيسة في المصدر (كأسماء الأعلام» والتواريخ؛ والأماكن) من أجل 
الاقتطاف (2003 ,11801 551). إلا أن وجه الصعوبة الرئيسء في اقتطاف المعلومات 
15 يكمن في توقفه أو اعتماده الجوهري على المجال الموضوعي؛ نظرا لأن المعرفة 
اللغوية تختلف من مجال لآخر اختلافا بيّنا. وقد تمت تجربة الضبط اليدوي 11812181 
عسنسحط للمعرفة اللغوية التي تتوقف على المجال الموضوعيء كمعاجم المصطلحات» 
والدلالة المعجمية المتصلة بالمجال الموضوعي على وجه التحديد, وأنماط الاقتطاف 
(2006 ,631818 يق ودف ,00دننا1)؛ غير أن إجراء اقتطاف المعلومات عبر 
المجالاات الموضوعية» لا يزال يشكل تحديا جوهريا. 

ومن الممكن إجراء اقتطاف المعلومات على مستويات متعددة من التجانس 
تأنه[ تصقمع (2001 تقطوء؟1 ثم 60019). فقد حاول كل من موجسيلوفك» 
وجوميزء وروجوفيتس (2004) 1080175112 220 202265) 14105111031 اقتطاف 
الإشارات الدلالية» كالجلد لأكاة. والسماء 'إ6[ة» والحشائش 87855) والجليد 651077 
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والأشياء الاصطناعية من مجموعات الصور. وفضلا عن ذلك. فإنه يمكن للاقتطاف 
لأغراض الرد على الاستفساراتء أن يتم أيضا بمرونة من حيث الطول؛ إذ يمكن 
لبعض المحتويات التي يتم اقتطافهاء أن تكون في حدود كلمة واحدة أو رقم, بينا 
يمكن لأخرى أن تكون عدة مئات من الكلمات طولا. 

واقتطاف المعلومات مكون مهم في استرجاع الفقرات» الأمر الذي يعني أنه 
ينبغي لاسترجاع الفقرات أن ينطوي على وسيلة للاقتطاف. ومن الممكن النظر إلى 
استرجاع الفقرات» على نحو ماء بوصفه حلقة في مسيرة تطور نظم الرد على 
الاستفسارات. ووجه الارتباط بين الرد على الاستفسارات واسترجاع الفقرات. هو 
أن الأول يقدم للمستفيد إجابات محددة كنتائج» بين| يوحي الآخر فقط بأن المعلومات 
متضمنة في الفقرة المسترجعة (2005 ,00463). وطول النتائج في استرجاع الفقرات: 
أقل على نحو لا يستهان به بالمقارنة بالطب - بنتائج استرجاع الوثائق. 

والخطوة الأخيرة في الرد على الاستفسارات هي اختيار الإجابة بعد اقتطاف 
المحتوى الأساس الوارد في المصدر. وتمائل هذه الخطوة الحكم على الصلاحية في 
العملية العادية لاسترجاع المعلومات, اللهم إلا أن البشرء لا النظام» هم من يصدرون 
الأحكام في أنشطة البحث في غياب تقنية الرد على الاستفسارات. وما لاشك فيه أنه 
من الصعب إلى حد بعيد» أن يكون هناك نظام للرد على الاستفسارات. بإمكانه الحكم 
على الصلاحية؟ نظراً لأن الصلاحية كما بينا في ١/7/١ /1١١‏ مفهوم معقدء إلى حد أن 
البشر أنفسهم يقفون عاجزين عن التعامل معه على نحو مرض.. إلا أن نظام الرد على 
الاستفسارات لا خيار أمامه له سوى اختيار الإجابات من المحتويات المقتطفة في حد 
ذاتها. وقد اقترح لن وكاتس (2006) 1 له سألا ما يلي» لاختيار الإجابة: 
فالمحتويات المقتطفة ينبغي أولا أن يتم الحكم عليها؛ ما إذا كانت داعمة أم غير داعمة 
أي غير صالحة» قبل اتخاذ قرار الاختيار؛ فالمحتويات الداعمة لا تشتمل على خيط 
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الإجابة فحسب. وإنما ينبغي أن يتم التحقق من الإجابة بثقة» عندما يتم ذلك بواسطة 
الإنسان» بوصفها صحيحة من المصدر. أما المحتويات غير الداعمة فتشتمل على خيط 
الإجابة الذي يرد في السياق الصحيح. إلا أنها لا تجيب عن السؤال فعلا. أما المحتوى 
غير الصالح فإنه إما أن يغفل خيط الإجابة كلية وإما يذكره عرضا أو من قبيل 
المصادفة. وتحدث هذه الحالة الأخيرة عند البحث بالكلمات المفتاحية» في معظم, إن 1 
يكن في جميع الأحيان. ومن بين الففات الثلاث لنتائج الحكم؛ يمكن اختيار 
المحتويات الداعمة فقّط بوصفها إجابات» وتقديمها للمستفيد» على الرغم من أنه 
ينبغي أن نلاحظ أن المحكمين البشر هم من يقومون بتحديد المحتويات الداعمة. إلا 
أن صلاحية الإجابة أمر آخر» يوضع في الحسبان في اختيار الإجابة ,1242 يه علصانة) 
(2006. فإلى أي حد على سبيل المثال؛ ينبغي أن يكون التاريخ المقصود على هذا 
النحو؟ فهل العام وحده كافء أم أنه ينبغي أيضا ذكر الشهر واليوم؟ 

وبإنجاز خطوة اختيار الإجابة» تصل عملية الرد على الاستفسارات برمتها إلى 
غايتهاء وذلك على الرغم من أن تقديم الإجابة» أحيانا ما يأتي بوصفه خطوة إضافية, 
أو الخطوة الأخيرة (2004 «لإاناط:383). وكما كان الباحثون يفعلون في-التلخيص 
الآلي؛ فإنه يتم اختيار مجموعة متنوعة من الطرق (الإحصائية» واللغوية» والقائمة على 
المعرفة» والتفاعلية على سبيل المثال) في تطوير نظم الرد على الاستفسارات. وتشكل 
هذه الطرق سلسلة طويلة» وغالبا ما تستخدم بتجميعات مختلفة. وقد وفر مسار الرد 
على الاستفسارات» الذي استمر من مؤتمر استرجاع النصوص الثامن 1120-8 
حتى مؤتمر 27٠01‏ وهو على هذا النحوء واحد من أطول المهام الخاصة وفر منصة 
قيمة لباحثي الرد على الاستفسارات» للتواصل فيما بينهم. يضاف إلى ذلك أن هذا 
المسار قد عزز حدوث طفرة في بيحوث الرد على الاستفسارات»؛ أسفرت بدورها عن 
تقنيات جديدة للرد على الاستفسارات (2005 ,ووع8001). ومن الممكن وللاشك؛ 
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لتأسيس مؤقر تحليل النصوص ©14» الذي أشرنا إليه بإيجاز في /١7‏ 7/ 7/ "”ء أن 
يوفر المزيد من الدوافع للبحث في الرد على الاستفسارات. 
تطبيقات الرد على الاستفسارات: 

هناك الآن نوعان من تطبيقات الرد على الاستفسارات؛ ينطوي أحدهما على 
التدخل البشري في عملية الرد على الاستفسارات» ولا ينطوي الآخر على مثل هذا 
التدخل. وتعتمد عمليات استرجاع المعلومات في الحالة الأولى» في الأساسء على 
قاعدة بيانات للأسئلة» إلى جانب قاعدة بيانات للإجابات في المقابل. ويقوم نظام 
استرجاع المعلومات أولا ببناء قاعدة بيانات الأسئلة» التي يتم تجميعها من مصادر 
مختلفة (كالاستفسارات التي تشتمل عليها سجلات عمليات البحث 1085 561:12 
على سبيل المثال). ثم يتم وضع إجابات لكل سؤال في قاعدة البيانات» اعتادا على 
المصادر المتاحة للمستفيدين المستهدفين (كمواقع العنكبوتية على سبيل المشال)» ويتم 
اختزانها في قاعدة بيانات الإجابات. وعندما يتم إدخال طلب في صندوق البحث» 
يراجع نظام استرجاع المعلومات قاعدة بيانات الأسئلة الخاصة به» لمعرفة ما إذا كانت 
هناك مضاهاة لهذا الطلب أم لا. وإذا ما تم العثور على مضاهاة بين طلب البحث 
وقاعدة بيانات الأسئلة» يسترجع النظام إجابة من قاعدة بيانات الإجابات» باتباع 
الرابطة الواصلة بين قاعدتي البيانات. وما لم يكن الأمر كذلكء فإنه لايتم تقديم 
نتيجة للبحث. وقد استخدمت الطبعة المبدئية لنظام آسك دوت كوم 28مع.كا45 
(الذي كان يعرف من قبل باسم آسك جيفز 1669765 ع451) وهو نظام لاسترجاع 
معلومات الإنترنت» هذه الطريقة الخاصة بقاعدتي بيانات الأسئلة والإجابات؛ الأمر 
الذي يوضح لماذا يقدم هذا النظام إجابات كاملة لبعض الأسئلة, ولا إجابات فيا عدا 
التشويش في معظم الأحيان. 
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أما الفئة الأخرى من نظم الرد على الاستفسارات (أي تلك التي تعتمد على 
تقنيات الذكاء الاصطناعي كاملة» وباتخاذ الخطوات التي سبقت مناقشتها) فلا وجود 
ها ؛ نظرا لأن مثل هذه النظم لا تزال دون الوضع الراهن للمعرفة في المجال 
(2005 ,7001655؟1)) ومن ثمء فإن الباحثين في هذا المجال. يتبعون نهجا للتفرقة 
والحزيمة عن وطمع-5<0ه-019106 مع الرد على الاستفسارات. بالتعامل مع المهام 
التي يمكن التعامل معها بشكل أيسر من غيرها (كالرد على الاستفسارات الحقائقية» 
واقتطاف المعلومات من مصادر العنكبوتية) قبل غيرها. ومن ناحية أخرى؛ تم وضع 
خريظة طريقء للتخطيط على نحو نسقي وعلى وجه التحديد. لبحوث المستقبل في 
الرد على الاستفسارات (2002 ,لإتناط:(118). 

ومن الملائم في النهاية» النظر في العلاقة التكاملية المفيدة على وجه المخصوص» 
القائمة بين التلخيص الآلي ونظم الرد على الاستفسارات؛ نظرا لأن تطور التطبيقات 
الأخرى (كالبحث في اللغة الطبيعية على سبيل المثال) يتوقف على كليهما. ومن منظور 
التلخيص. فإن الرد على الاستفسارات أحد طرق كفالة التركيز للتلخيص الموجه نحو 
الاستفسارات» ومن منظور الرد على الاستفسارات فإن التلخيص أحد طرق اقتطاف 
المعلومات الصالحة فقط ونشرهاء من كل النصوص. إجابة لسؤال غير حقائقي بعينه 
(2000 .1 ا العسوطمة©). وفضلا عن ذلكء فإن التلخيص الآلي والرد على 
الاستفسارات يواجهان. من تحديات جوهرية ممائلة» في مساراتهها نحو النضج» 
كتطبيقين رئيسين للذكاء الاصطناعي في تنظيم المعلومات واسترجاعها. 
البحث باللغة الطبيعية: 

يعني البحث باللغة الطبيعية (أو الاستفسار بها) أن بإمكان المستفيد إدخال 


عمليات بحث محددة (كالعبارة أو السؤال على سبيل المثال) دون المرور بعملية صياغة 
الاستفسار أو التعبير عنه. وتدل صياغة الاستفسار أو التعبير عنه, الذي نوقش في 
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5/ '. على عملية ترجمة طلبات البحث, إلى استفسارات يمكن لنظام استرجاع 
المعلومات معالجتها. فلاذا السماء زرقاء؟ على سبيل المثشال» سؤال بحث باللغة 
الطبيعية» لا يمكن لنظام استرجاع المعلومات التقليدي معالجته على النحو الملائم. إلا 
أن نظام استرجاع المعلومات نفسه ينبغي أن يكون قادرا على التعامل مع استفسار 
بحث من قبيل غتااط 41310 تإكاى, دون أي مشكلات. 
ويوضح هذا المثال وجه الاختلاف الجوهري بين نظم استرجاع المعلومات 
التي تدعم البحث باللغة الطبيعية» وتلك التي لا تدعم ذلك؛ ففي الحالة الأولى يقوم 
نظام استرجاع المعلومات بإنجاز مهمة صياغة الاستفسار للمستفيدء بين| من المتوقع 
في الحالة الأخرى. أن يقوم المستفيد بإنجاز عملية صياغة الاستفسار. حتى يكون 
بإمكان نظام استرجاع المعلومات معالجته. وبعبارة أخرى. فإنه بالنسبة للسؤال ””لماذا 
السماء زرقاء؟“ #عناط نركاد عط) 15 نإط177 كمثال» يمكن لنظم استرجاع المعلومات» 
القادرة على معاللجة استفسارات اللغة الطبيعية» أن تكون قادرة على الأقل» على تنفيذ 
مايلٍ: 
. تدل كلمة لماذا لإ" على أن ما يتم البحث عنه يتعلق بالسببء أو العلة؛ أو 
إجابات ماثلة أخرى للسؤال. 
ه أما الكلمتان 15 و42 الواردتان في السؤالء فهما ممايسمى بالكلمات 
الوظيفية» ولا يمكن إيرادهما في استفسار البحث. 


«٠‏ أما الكلمتان لإكآة و عناآط فمن الكليمات المهمة» حيث ينبغي الربط بينهم| 
بالمعامل البولينى 24111 ليشكلا استفسارا لهذا السؤال. 

٠‏ ويتم تجاهل علامة الاستفهام في معالحة الاستفسار باللغة الطبيعية؛ نظرا لأن 
علامات الترقيم لا تشكل عادة جزءا من الاستفسارء مالم يتم النص على 
عكس ذلك على وجه المخصوص. 
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وربما تبدو هذه الخطوات سهلة بالنسبة للبشرء إلا أنها تفرض تحديات ضخمة 
بالنسبة لنظام استرجاع المعلومات. وتلك التخديات هي في الأساس ما يحاول 
الباحثون في معالجة اللغة الطبيعية التصدي لما. على الرغم من أن البحث باللغة 
الطبيعية يبدو بالفعل شديد الجاذبية» فإن تطبيقه يعتمد بكثافة على البحث والتطوير» 
في التلخيص الآلي والرد على الاستفساراتء اللذين نوقشا في 7١/؟7/‏ 5 و7١/7/7.‏ 

ويتم اتباع النهجين الرئيسين لتطوير نظم الرد على الاستفسارات (راجع 
)١ 5‏ في إجراء البحث باللغة الطبيعية أيضا. وطريقة قاعدتي بيانات الأسئلة 
والإجابات. التي تناولناها آنفا يكتنفها القصورء إذ أن تقنيتها الأساس يدوية فعلا. 
وفضلا عن ذلك فإن الطلب لا يمكن بحثه أو النظر فيه» إلا إذا كان متضمنا فعلا في 
قاعدة بيانات الأسئلة الخاصة بنظام استرجاع المعلومات. غير أنه لا يمكن لأي قاعدة 
بيانات؛ مهما بلغت ضخامتهاء أن تشتمل على جميع الأسئلة التي يمكن للمستفيدين 
توجيههاء ومن ثم فإن نظام استرجاع المعلومات يصبح لا جدوى منه؛ عندما تخلو 
قاعدة البيانات من سؤال معين» حتى وإن كان النظام يدعم ما يسمى بالبحث باللغة 
الطبيعية. ويظل النهج الآخر للبحث باللغة الطبيعية» ى) أوضحنا في 7١/؟/ /٠‏ ”ل 
رؤية أكثر منه حقيقة؛ نظراً لأن تقنيات معالجة اللغة الطبيعية: بالنسبة لإنشاء نظم 
عاملة للرد على الاستفسارات, لا تزال في مرحلة التطوير» ومن ثم فإن قليلا فقط من 
نظم استرجاع المعلومات» التي تدعم البحث باللغة الطبيعية» قد أصبحت حقيقة 
واقعة حتى الآن. 

وأحيانا ما يسمى البحث باللغة الطبيعية بواجهة اللغة الطبيعية؛ نظرا لأن 
الواجهة هي ما يتفاعل معها المتعامل مع نظام استرجاع المعلوماتء أثناء عملية 
البحث. وفضلا عن ذلك فإن الخطوتين الأوليين في عملية الرد على الاستفسارات 
(وهما إعراب الاستفسار أو تحليله وتصنيف السؤال) ترسيان في جوهرهماء الأساس 
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بالنسبة للبحث باللغة الطبيعية؛ ولحذاء فإن البحث باللغة الطبيعية» شأنه شأن 
استرجاع الفقرات» مرتبط بتطور تقنية الرد على الاستفسارات. وأخيرا ينبغي أن نبين 
أن البحث باللغة الطبيعية» ليس بحثا بدون أي استخدام للغات المقيدة (كالمكانز على 
سبيل المثال). ويسمى البحث في الحالة الأخيرة ببحث الكلمات المفتاحية. 


العنكبوتية الدلالية: 


العنكبوتية الدلالية © 5602511 هي أكثر المشروعات التي نفذها اتحاد 
العنكبوتية العالمية (32نا)::00250) 186 71106 919010) 73 وكثير من الباحثين» 
طموحا حتى الآن؛ فقد كانت جزءا من رؤية تيم بيرنرز-لي ©6.[-15ع8628 صسذكء 
منذ أعد الطبعة الأولى من العنكبوتية» في مطلع العقد الأخير من القرن العشرين» على 
الرغم من أن بيانا ووصفا للعنكبوتية الدلالية المتصورة: لم يصدر إلا بعد حوالي عقد 
من الزمن في (2001) هلأدقهآ مسق 168501 رعع.ط-ومعم8»2. ويعرّف المؤلفون 
في هذا البحث قوي التأثير» العنكبوتية الدلالية بوصفها امتدادا للعنكبوتية الراهنة» 
يتم فيه إضفاء معنى واضح على المعلومات؛ على نحو يمكّن البشر والحاسبات من 
العمل معا بشكل أفضل. وفي سياق تبرير إدخال مجال موضوعي جديد» وهو علم 
العنكبوتية» في التعليم العالي» واصل بيرنرز-لي» وهولء. وهندلر وععطآ-وتعصمء8 
(2006) 18165016 4صق 11311 القول على وجه التحديدء بأنه في عنكبوتية الوثائق 
القائلة القراءة بواضيظطة لشي بإمكان اسالحت شال للق الشعية مطاف يعض 
الدلالة أو المعنى من صفحات نصوص هذه الوثائق. ويمكن لعنكبوتية من البيانات 
العلائقية» والتأكيدات المنطقية» والطرق الإيعازية ©3)وة#تاعط أن تلخص معا المعاني 
أو الدلالات المقصودة التي تستعمل في التواصل البشري. وفضلا عن ذلكء فإن 
العنكبوتية الدلالية» بمجرد تنفيذهاء يمكن أن تكفل لنظم البيانات التي وضعت 
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بمعزل بعضها عن بعضء الارتباط معاء دون الحاجة إلى اتفاق عام حول المصطلحات 
والمفاهيم. 

ونظرا لأن العنكبوتية الدلالية لا تزال مجرد رؤية» على الرغم من التوصيفات 
الخيالية المثيرة» التي ترد في نصوص عدة. فإن المزيد من المعالجة النظرية لا يمكن أن 
يكفل أي تأكيد أو إثبات أو برهان» وإنم| يكفل المزيد من التخمين بشأنها. ومن ناحية 
أخرى» أجريت البحوث النشطة في مجالات عدة. كا هندسة المعمارية للعنكبوتية» 
لتيسير تطور العنكبوتية الدلالية. ' 


الهندسة المعمارية للعنكبوتية الدلالية: 


حتى قبل انتشار عبارة العنكبوتية الدلالية» وضّح بيرنرز-لي ع©.طآ-وتعدمء8 
(2000) معالم الهندسة المعمارية هذه العنكبوتية» في رسم بياني من سبع طبقات (الشكل 
رقم .)١/17‏ وقد قدمت منذ ذلك الحين» تفسيرات لهذا الرسم البياني» من جانب 
عدة مؤلفينء في سياقات مختلفة» ومن زوايا مختلفة (راجع على سبيل المشال 
7 ,1.88 :2003 رق 25ء»2)). ولا تبدو هناك ضرورة لتكر ار شرح كل من 
الطبقات السبع في هذه ال هندسة المعمازية. وعوضا عن ذلك» سوف نلقي أولا نظرة 
فاحصة دقيقة على هذه الطبقات» من القاعدة إلى القمة؛ فالطبقة الثانية (لغة الترميز 
القابلة للامتداد 341+ فضاء الاسم 118+ خطة لغة الترميز القابلة للامتداد 
23 والطبقة الثالئة (إطار وصف المصادر '11(1+ خطة إطار وصف 
المصادر 7028©طء5015). و الطبقة الرابعة (لغة التصنيف 7إ1ةآتاطهء0؟ 050101087). 
والطبقات مرتبة في الرسم البياني» تبعا لأهميتها المباشرة بالنسبة لتنظيم المعلومات 
واسترجاعها. أما الطبقات الأربع الأخرى؛ أي الأولى (الترميز الموحد ع0معءتسنا 
والمحدد ال موحد للمصدر 711]) والخامسة (المنطق)؛ والسادسة (البرهان) والسابعة 
(الثقة)» فلا تحظى بالمناقشة في هذا الكتاب؛ نظرا لأن الترميز الموحد والمعرف الموحد 
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للمصدر يمثلان مرحلة ما قبل العنكبوتية الدلالية» بين للطبقات الثلاث الأخيرة 
علاقة غير مباشرة بتنظيم المعلومات واسترجاعهاء في هذا السياق. على الرغم من أنها 
تنهض بأدوار حاسمة في تكوين العنكبوتية الدلالية. 

وكا يتضح من الشكل رقم »١/١7‏ فإن الدلالة التي يتم تجميعها وتنظيمها 
ونشرها عن طريق العتكبوتية الدلالية» يتم اشتقاقهاء وكذلك تحديدها أو تعريفها 
بالطبقات الثلاث الخاصة ببندستها المعمارية» التي نحاول استكشافها في هذا السياق. 
وتتكون الطبقة الثانية من ثلاثة عناصرء هي لغة الترميز القابلة للامتداد. التي تكفل 
القدرة على إنشاء ما وراء البيانات الخاصة بمعنادر'المتكبوية قينا رج طن حيدود 
مستوى النظم» بينا يسر كل من فضاء الاسم (5]ا) 2م 1ءتدوللء وخطة لغة 
الترميز القابلة للامتداد 38صعطء2:31 (أي إطار ترميز لغة الترميز القابلة للامتداد) 
استخدام قابلية ما وراء البيانات للتشغيل التبادلي؛ في لغة الترميز القابلة للامتداد 
83. وعلى عكس لغة ترميز النصوص الفائقة «تكلتيه]/ا أبدء1' م«عم12 
(8]1110) عومتعومصصل التي : تصوغ 1018384 ما هو موجود على العنكبوتية فقط 
(كالبنط والحجم على سبيل المثال) يمكن للغة الترميز القابلة للامتداد أن تصوغ 
معلومات العنكبوتية» بنفس طريقة تكشيف قاعدة البيانات بالحقل (كالمؤلف 
والعنوان على سبيل المثال). فهب أن لدينا المؤلف 1206 صطول» الذي نشر المقالة 2. 
وباستخدام لغة ترميز النصوص الفائقة» فإن كل ما نستطيع عمله هو صياغة اهل 
00 و8 0116 ة.؛ بخيارات الصياغة المتاحة» كا لحروف المائلة 11211625 وبنط التايمز 
الروماني الجديد مقدده1 215 وعدسلل وحجم الخط ١7‏ على سبيل المثال. 


غير أنه في حالة لغة الترميز القابلة للامتداد 350341» يمكن ترميز المعلومات 
نفسها على شكل: <20]:ة/> 106 معطمل <امطامهة> و <حدملاقء تاطنام> 
<05 هع تاطنام/> 8 عاعتنامة على التوالي. ونظرا لأن ترميز لغة الترميز القابلة 
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للامتداد» يعمل بطريقة مماثلة إلى حد بعيد للتكشيف بالحقل» أحد خطوات إنشاء 
قواعد البيانات التقليدية؛ فإنه ينبغي توفير تقنية ما للتحكم؛ لضن قابلية الترميزات 
الناشئة» بمختلف النظمء في مجحالات مختلفة» للتبادل أو التشغيل التبادلي فيم| بعد؛ 
ف <100اهء ااطدم/>...خده0)هء1اطناع> على سبيل المثال» هو ترميز لغة الترميز 
القابلة للامتداد بالنسبة لجميع أنواع النصوصء ولا ينبغي استعمال شكل آخر 
لمع سناء 0 10/... لمع سناع هل على سبيل المثال. وفضاء الاسم 215 وخطة لغة 
الترميز القابلة للامتداد 21151228 تقنيتان للتحكم» لثل هذه الأغراض. ويمشل 
فضاء الاسم 218 أحد المجالات (كالتجارة الإلكترونية المحلية على سبيل المثال)؛ 
وتوفر خطة لَغةٍ الترميز القابلة للامتداد» قواعد وتوجيهات لتكوين ترميزات هذه 
اللغة بالنسبة للمجال المستهدف. 

ويستخدم إطار وصف المصادر (10217؛ راجع أيضا /7/١/7‏ 7), وخطة 
إطار وصف المصادر 50445656188, بوصفهه) الطبقة الثالثة في الهندسة المعمارية 
للعنكبوتية الدلالية؛ للتعبير عن العلاقات في بين ما وراء البيانات (أي ترميزات لغة 
الترميز القابلة للامتداد) التي تعد لمعلومات العنكبوتية: في الأشكال الماثلة لإطار 
وصف المصادر (الشكل رقم /١7‏ 7). وني حالة " المؤلف 206 هطو3 الذي نشر 
المقالة 8“ على سبيل المثال» فإن العلاقة في هذه العبارة (أي 106 صطول هو ”مؤلف 
المقالة 38'“» موضحة في الركن الأسفل الأيمن في الشكل رقم ؟١١/‏ 7. ووظيفة خطة 
إطار وصف المصادرءكوظيفة خطة لغة الترميز القابلة للامتداد» هي ضان أن تكون 
جميع الأشكال البيانية لإطار وصف المصادر قد نشأت باتباع خطة ممائلة» بحيث 


الوم 


تكون هذه الرسوم البيانية قابلة للتشغيل التبادلي بوجه عام, في العنكبوتية الدلالية. 
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1 1 تداد + قضاء الإسم + خطة لغة الترميق: . ِ لامتداد : 000 


لي ل 4 الترميز الموحد ©16006ملا 





الشكل رقم ١/١١‏ الهندسة المعمارية للعنكبوتية الدلالية 
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وكا بينا في 5/ 5/ ”27 فإن التصنيفه التخصصي عنصر جوهري في العنكبوتية 
الدلالية؛ نظرا لأن نجاح العنكبوتية الدلالية العالمية يتوقف في النهاية على هذا 
العنصرء لتحقيق التعامل فيه| بين مصادر العنكبوتية» التي يتم ترميزها بلغة الترميز 
القابلة للامتداد والتعبين عئها بالرسوم البيانية لإطار وصف المصادرء في جميع أنحاء 
العالم» إلى جانب القواعد المنطقية التي تقابلها بالنسبة للبرهان. ويمكن النظر إلي 
التصنيف التخصصيء على نحو ماء بوصفه لغة مقيدة عامة (كخطط التصنيف أو 
المكانز على سبيل المثال) بالنسبة لتنظيم مصادر العنكبوتية. ووجه الاختلاف الرئيس 
بين التصنيف التخصصي 101087 واللغة المقيدة التقليدية» هو أن الأول قد قصد به 
التعامل مع العنكبوتية برمتهاء بوسائل آلية؛ بين| الآخر يدوي بوجه عام, ولا يطيق 
مطلقا على نطاق يغطي جميع المجالات في العالم. وبعبارة أخرى» فإن لغة التصنيف 
التخصصيء الطبقة الرابعة في الهندسة المعمارية للعنكبوتية الدلالية» يمكن أن تساعد 
الحاسب في فهم معنى مصادر العنكبوتية» التي يتم تجهيزها في الطبقتين السابقتين» 
عندما يستخدم ذلك التصنيف على نطاق عام. 

وتتضح نقطتان من هذا الوصف للطبقات الثانية والثالئة والرابعة للهندسة 
المعمارية للعنكبوتية الدلالية؛ أولاهما أن ما يمكن للعتكبوتية الدلالية القيام به. من 
حيث استنباط دلالات المعلومات» يمكن أن يبدو مثيرا وطموحا في الوقت نفسه. 
وثانيتها أن كل ما يمكن أن تنهض به الطبقات الثلاث» ليس أكثر من تنظيم 
المعلومات على منصة العنكبوتية» ويتراوح هذا التنظيم بين التكشيف بالحقل (أي 
ترميز لغة الترميز القابلة للامتداد) والضبط الشامل للغة بالنسبة للعملية (كلغة 
التصنيف التخصصي على سبيل المثال). 
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العنكبوتية الدلالية وتنظيم المعلومات واسترجاعها: 

وفقا للهندسة المععارية للغنكبوتية الدلالية» التي عرضنا لما في »٠/7 /١7‏ فإن 
للعنكبوتية الدلالية آثارها واسعة المدى» بالنسبة لتنظيم المعلومات واسترجاعها. 
والتنظيم والاسترجاع الدلالي للمعلومات على العنكبوتية» والوكلاء الأذكياء» مثالان 
مثل هذه الآثار. 


التنظيم والاسترجاع الدلالي للمعلومات على العنكبوتية: 

يتسم استرجاع معلومات العنكبوتية بالسمعة السيئة؛ نظرا لتدني مستوى الدقة 
أو التحقيق وارتفاع التشويش. وبين) نجد هناك كثيرا من العوامل (كغياب الضبط أو 
اتتحكم في المدخلات على سبيل المثال)» التي تسفر عن هذه المشكلة» يظل تكشيف 
الكلمات المفتاحية لمعلومات العنكبوتية» السبب الرئيس. وقد بذلت جهود مختلفة 
(كاستعمال رؤوس الموضوعات للتكشيف على سبيل المثال) لتوفير الكلمات غير 
المفتاحية» أو بمزيد من الدقة» التنظيم المفاهيمي لمعلومات العنكبوتية. إلا أن هذه 
الجهود قد بذلت على نطاق محدود فقطء ولم يكن لما تأثير يذكرء على الارتفاع بمستوى 
أداء تنظيم المعلومات واسترجاعها في العنكبوتية» في ظل وجود الكميات الحائلة من 
المعلومات في هذه البيئة» بالإضافة إلى الخصائص الأخرى لمعلومات العنكبوتية. 

وتتعلق قضية التحقيق المنخفض والتشويش المرتفع؛ في استرجاع معلومات 
العنكبوتية» في الأساسء بالدلالات أو ”المعاني المقصودة المستعملة في التواصل 
البشري"”"» ىا عبر عن ذلك بيرنرز-لي» وهولء. وهندلر 2ه 11811 رعع.آ-وسمعصمء8 
(770 .2 ,2006) ع501ع11. فإذا كان بإمكان العنكبوتية الدلالية استنباط الدلاللات 
من معلومات العنكبوتية» ىا كان من المنتظرء لأمكن لمشكلة التحقيق المنخفض التي 
يعاني منها استرجاع المعلومات في العنكبوتية» أن تحل» أو يتم التخفيف من حدتها على 
الأقل؛ فاستعمال لغة الترميز القابلة للامتداد 1311؛ على سبيل المثالء في ترميز 
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معلومات العنكبوتية» يمكن أن يكفل للمستفيد أن يقول وداعا لاسترجاع معلومات 
العنكبوتية غير محددة الحقول» ويرحب باستعمال البحث بالحقل. وفضلا عن ذلك» 
فإن التحكم في اللغة» في تنظيم المعلومات واسترجاعها في العنكبوتية» يمكن أن يكفل 
للمستفيد القدرة على التحقق» على سبيل المثال» ما إذا كانت الكلمة علصهط تعني 
مؤسسة مالية» أم الأرض المرتفعة على ضفتي النهر. ويمكن من ناحية أخرى, لتنظيم 
المعلومات الدلالية واسترجاعهاء أن يكون بإيجاز» حقيقة واقعة بمجرد أن تتطور 
العنكبوتية الدلالية. 
الوكلاء الأذكياء: 

بإمكان الوكلاء الأذكياء؛ باستخدام أساليب ذكاء اصطناعي متنوعة؛ وفي 
شكل برمجيات الحاسبات» إنجاز مهام معينة دون تدخل بشري. ومن ناحية أخرى 
فإن النظم الخبيرة تعرف بأنها برمجيات حاسبية تدلي بالمعلومات» أو تصدر التوصيات» 
أو تحل المشكلات» بطريقة وعلى مستوى أداء» يضاهي ذلك الذي يبديه الخبير البشري 
في المجال. والنظم الخبيرة في جوهرها وكلاء أذكياء على نطاق واسع. أو أسلاف 
الوكلاء الأذكياء. ويتزايد استعمال كلمة بوت 088 (الشكل المختصر لكلمة 
45 بوصفها مرادفة للوكلاء الأذكياء. 

وقد انتشر مفهوم الوكلاء الأذكياء» إلى حد ماء بفضل بيرنرز-لي» وهندلرء 
ولاسيلا (2001) 1255119 © 11820167 رعع.ط-186582225) عندما قدموا رسمياء 
العنكبوتية الدلالية للجمهور العام؛ ففي تلك المقالة/» وصف المؤلفون الثلاثة 
بوضوح. وكيلا قادرا على جدولة المواعيد الطبية. وقد استعرض دنت (2007) 4م12 


(*) تقصد المقالة التي تناول فيها المؤلفون الثلاثة فكرة العتكبوتية الدلالية. وقد وردت بيانات تلك 
المقالة كاملة في قائمة مراجع هذا الفصل. (المترجم) 
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كثيرا من الجوانب الخاصة بالوكلاء الأذكياء» كخصائصهم ووظائفهم على سبيل 
المثال» من منظور --3 الحديثة 0 ذهب 0-0 (1999) «016مع8 فإن الوكيل 
.١‏ 00 
؟. قادرًا: أي القدرة على حسم الخيارات» لا مجرد تقديم النصح ببساطة. 
“. مسيّرا ذاتيا: القبدرة على التصرف دون أن يكون تحت سيطرة المستفيد 
طوال الوقت. 
ع تكيفيا: القدرة على التعلم من الخبرة المكتسبة» حول مهامه وأفضليات 
المستفيد منه. 


وتطبيقات الوكلاء الأذكياء كثيرة ومتنوعة» في نطاق مجال تنظيم المعلومات 
المعو وخارج هذا المجال على السواء. وأيا كان الهدف الذي من أجله يتم 

تصميم الوكيل الذكيء فإنه ينبغي أن تتوافر الخصائص الأربع التي حددها هندلر. 
ويمكن الإفادة من الوكلاء الأذكياء في كثير من المواقف المختلفة» التي تتراوح بين 
أمور حياتنا اليومية» ومشروعات البحوث والتطوير المعقدة. ومن الممكن العثور على 
عدد كبير من الوكلاء الأذكياء. وخصوصا على الصعيد العام» في موقع بوتسبوت 
(5015201.60112.؟0959) 18015701. 


ويستهدف الوكلاء الأذكياء؛ بالنسبة لتنظيم المعلومات واسترجاعهاء فروعا 

محددة بعينها في المجال؟ فمهام تنظيم المعلومات واسترجاعهاء المعروفة على أحسن 
جه بشكل عام» يمكن التحقق منها صراحة؛ ولما حدود واضحة المعالم» يمكن 
للوكلاء الأذكياء النهوض بها الآن. والبث الانتقائي للمعلومات (5101) أحد أمثلة 
هذه المهام» إذ يمكن للوكلاء الأذكياء مراقبة نظام واحد لاسترجاع المعلومات أو 
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أكثر» وإخطار المستفيد عندما ترد إلى النظام معلومات جديدة في موضوع معين. 
والتقسيم الفئوي للنتائج المسترجعة؛ المألوف في نظم استرجاع الإنترنت» نظرا 
لضخامة كم مخرجات هذه النظم؛ مثال آخر في هذا الصدد. وأشهر أمثلة الوكلاء 
الأذكياء في تنظيم المعلومات واسترجاعهاء برامج تجميع البيانات لنظم استرجاع 
معلومات الإنترنت» وتسمى أحيانا بالزواحف 678391675 أو الشواخص الآلية 
15., أو العناكب. ويزور هؤلاء الوكلاء المواقع المستهدفة بانتظام» ويستنسخون 
معلومات معينة» ويزسلوها إلى قاعدة بيانات النظام. 

000 
يكون مهمة عصية بالنسبة للوكلاء الأذكياء. ويشكل الوكلاء الأذكياء بالنسبة لهام 
تنظيم المعلومات واسترجاعهاء التي تفرض تحديات أكثرء كصياغة الاستفسارات» 
وتمثيل المعلومات أو التعبير عنهاء موضوعات للبحث في الوقت الراهن. فقد قصد 
على سبيل المثال» بأساليب الرد على الاستفساراتء التي تطبق في بعض نظم استرجاع 
المعلومات» التعرف عن طريق توجيه الأسئلة» على ما يريده المستفيد فعلاء عندما 
يكون بصدد إعداد طلب للمعلومات. ومحاولات تطوير وكلاء أذكياء بإمكانهم 
تجميع الملخصات والمستخلصات الآلية» تجري الآن أيضا على قدم وساق» وخصوصا 
بالنسبة للمعلومات الإخبارية» ومعلومات إدارة الأعمال (راجع 2200 
ويتوقف نجاح هذه الجهود في النهاية» على البحث في الذكاء الاصطناعي. 

ومن الممكن النظر إلى إضفاء الطابع الشخصي على عمليات البحثء» بوجه 
عام بوصفه امتدادا للوكلاء الأذكياء» حيث يكون نظام استرجاع المعلومات مصما 
على نحو يتيح إمكانية تجميع سمات المستفيد 116 56ناء وتاريخ عملية البحث» 
وغيرها من المعلومات المتصلة بذلك المستفيد» معا لتشكيل تقنية أشبه بالوكيل. 
ويمكن تنشيط هذه التقنية في عملية الاسترجاع. لمساعدة نظام استرجاع المعلومات في 
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التعرف على ما يريده المستفيد فعلا في الموقف الراهن. فالمستفيد على سبيل المثال» قد 
يُدخل كلمة 8978[ كاستفسار في صندوق البحثء» وحينئذ تقوم تقنية البحث ذي 
الطابع الشخصي فورّاء بإجراء سلسلة من المهام (كمراجعة سهات المستفيد وتاريخ 
عملية البحثء على سبيل المثال) للكشف عما قصد بمعنى 1278 في هذه الحالة. وإذا 
كانت هناك للمستفيد خلفية في البريجة» فإنه من المرجح أن تكون 12978 لغة للبرمجة» 
يود المستفيد العثور عليها. وإذا كانت سات المستفيد لا تشتمل على معلومات حول 
البرمجة» إلا أنه يتضح من تاريخ عملية البحث الخاصة به» أن مواقع وكالات السفر 
قد تمت زيارتها مؤخراء فإن 858[ يمكن أن تدل هنا على جزيزة جافا 1888 في 
إندونيسيا. كذلك يمكن التحقق ما إذا كانت 18978 نوعا من البن أم لها معانٍ أخرى, 
عن النحو نفسه؛ في نظام لاسترجاع المعلومات يدعم البحث الشخصي. وتخرج قضية 
الخصوصية المتصلة بالبحث الشخصي عن نطاق اهتمام هذا الكتاب. 


التحديات التى تواجهها العنكبوتية الدلالية كأحد تطبيقات الذكاء 
الاصطناعي: ١‏ 

على الرغم من التقدم الملحوظ في تطور العتكبوتية الدلالية؛ يتساءل كثير من 
الباحثين (من أمثال 2004 ر5ع108 كلءمقم5 :2004 ,8:ه0'11 :2007 ,وعع.1) حول 
جدوى هذا التطبيق الخاص بالذكاء الاصطناعي. والعنكبوتية الدلالية» لم يقصد بها أن 
يتم إنشاؤها وصيانتها عن طرييق البشر» كما كان يحدث في تنظيم المعلومات 
واسترجاعها بالأساليب التقليدية» وإنم| يمكن استخدام تقنيات الذكاء الاصطناعي 
بكثافة» في تطوير العتكبوتية الدلالية» وما يتبع ذلك من عمليات. على النحو الذي 
يمكن أن يثير أسئلة أكثر تما يمكن للباحثين في المجال الإجابة عليه. أما فكرة الدلالة 
التي تمثل أساس هذا التطبيق» فتضغط من ناحية أخرى على زناد المزيد من التساؤلاات؛ 
نظرا لأن كيفية إنجاز البحث المفاهيمي يعصفطء:568 4م0006 في بيئة آلية» كانت منذ 
زمن بعيدء مشكلة جوهرية تحظى بالدرس من جانب كثيرين في المجال. 
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وهناك في المقام الأول: نوعان من التحديات التي تواجه رؤية العنكبوتية 
الدلالية؛ يتعلق أوهما ببذه العنكبوتية بوصفها أحد تطبيقات الذكاء الاصطناعي» 
ويتصل الآخر بقدرتها المنتتظرة على نقل الدلالات بالوسائل الآلية. ونتناول النوع 
الأول من التحديات في /١7‏ 4» عندما نلقي نظرة فاحصة على العلاقة بين الذكاء 
الاصطناعي وتنظيم المعلومات واسترجاعها. أما الضرب الآخر من التحديات 

أؤلاة من اتدى يمعنو اه عيبل تهرك ترمد عي تصادر تعلوينانة 
العنكبوتية بلغة الترميز القابلة للامتداد 2141» ثم التعبير عنها بالرسوم البيانية 
بأشكال إطار وصف المصادر "181(1؟ ثانياء من الذي يمكن أن يتحمل مسئولية تطوير 
وصيانة خطط لغة الترميز القابلة للامتداد 3331961611385 وخطط إطار وصف 
المصادر 5045862335 وخطط التصنيف التخصصية 0810108365 اللازمة لضيان 
استعمال الدلالات المشتركة: الناشئة عن الهندسة المعمارية للعنكبوتية الدلالية» 
والتشغيل التبادلي هذه الدلالات؟ ثالثاء هل يمكن وضع تصنيف واحدء يمكن أن 
يطبق في جميع المجالات واللغات والثقافات الموجودة على هذا الكوكب؟ ويتم طرح 
هذه التساؤلات الثلاثة في الأساس» من جانب الباحثين من خارج تجمع العنكبوتية 
العالمية )1783 (من أمتال رقعص0[ عاءعقم5 :2004 ,ومهكة'0 :2007 روعع.1 
4,. إلا أن بيرنرز-لي ورفاقه أنفسهم (مثل ,50065ع]1 يق للهآ1 ,ععآ-وعصء8 
6) يطرحون تساؤلات أخرى. ومن بين التساؤلات التي تطرحها هذه المجموعة» 
على سبيل المثال» كيف يمكن جعل كل المعلومات التي تتم معالجتها للعنكبوتية 
الدلالية» قابلة للتداول في المجال العام» نظرا لأن التعامل المجاني 6655 «9عم0 أحد 
الشروط الأساس التي ينبغي للعنكبوتية الدلالية الوفاء بها. 
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وقد أثار شادبولت» وهولء وبيرنرز-لي -ومع ص8 سه الدك8 رأامطمقطك 
(2006) ععن1 المزيد من التساؤلات المتعلقة بالعنكبوتية الدلالية بوججه عام؛ عندما 
عاودوا النظر في هذه الرؤية؛ كيف على سبيل المثال» يمكننا استجواب الأعداد 
الضخمة من مستودعات المعلومات اللامركزية» متفاوتة الأحجام؛ على نحو فعال؟ 
كيف ننسق» ونضع خرائط الربط بين خطط التصنيف؟ كيف نبني متصفحا 
للعنكبوتية الدلالية» لتصور الرسوم البيانية لإطار وصف المصادر. المترابطة الضخمة» 
والملاحة فيها بشكل فعال؟ كيف نبني الثقة والمصداقية في المحتوى؟ . : 

ووجهات النظر في العنكبوتية الدلالية في تغير مستمر» نتيجة للبحوث الجارية» 
والتطورات التقنية؛ فالتصنيف. على سبيل المثال» كان ينظر إليه بوصفه كيانا واحدا 
يمكن أن يشمل معارف العالم بأسره. في الهتدسة المعمارية للعنكبوتية الدلالية» الواردة 
في الشكل رقم .١ /١7‏ كا تبين فيهما بعد» أن وضع خطط التصنيف التي تركز على 
قطاعات صغيرة» أو على مجالات واضحة المعالم والحدود؛ ليس بالأمر غير الواقعي 
فحسبء وإنما لا يمكن تطبيقه أيضاء على النحو الذي كان يتم به إنشاء القواعد 
المعرفية للنظم الذكية في الأيام الخوالي. ومن الصعب عادة التنبؤ بالمستقبل. ويصدق 
الأمر نفسه. وعلى نحو أكثر تأكيداء فيا يتعلق بمستقبل العنكبوتية الدلالية. 


الذكاء اللاصطناعي وتنظيم المعلومات واسترجاعها: 

إلى أي مدى يمكن للذكاء الاصطناعي المضي قدما في تنظيم المعلومات 
واسترجاعها؟ ولا نجد إجابة لهذا التساؤل حتى الآن؛ نظرا لأنه في المقام الأولء يبدو 
بناء وبرمجة تقنية يمكن أن تحاكي بنجاح الأنشطة الذكية للبشرء ليس بالمهمة البسيطة. 
ويفكن لذللك أن يكون أصبعي حبة موز يمكين كسرهاء فق يحوت التذكاء 
الاصطناعي (1999 ,مات جمعءعومهء). 
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ومن ثم فإن دور الذكاء الاصطناعي في تنظيم المعلومات واسترجاعها اليوم 
محدود. ولا ينبغي المبالغة في هذا الدور» لسببين؛ أولما أن المهام المعقدة التي ينطوي 
عليها تنظيم المعلومات واسترجاعهاء تعتمد على رصيد معرفي واسع المدى» ى| تعتمد 
على استخدام هذا الرصيد على نحو مرن ويناء. وثانيها أن كثيرا من عمليات تنظيم 
المعلومات واسترجاعهاء لا تتم إلا على نحو سطحي ضحلء. حتى وإن كان ذلك يتم 
بواسطة البشر (1991 ,10265 علع1م8). وقد علق سوانسون (1988) 57982502 
ذات مرة قائلا ”على الرغم من أن هدف كثير من البحوث المتقدمة في استرجاع 
المعلومات» هو جعل الحاسبات كيانات أشبه بالبشرء فإن احتمال أن يكون الناسن أشبه 
بالبشر لا ينبغي التغاضي عنه . 

ولا ينبغي فعلا التغاضي عن دور البشر في تطوير تطبيقات الذكاء الاصطناعي؛ 
لأغراض تنظيم المعلومات واسترجاعها. فالحاسب لا يتمتع بحدة الذهن؛ أو العمق» 
أو الاتساعء أو الثراء الذي يتسم به الذكاء البشري؛ نظرا لأن الحاسب لا يزال أبسط 
مليون مرة من العقل البشري (2000 ,3©ه11©2). إلا أنه بإمكان الذكاء الاصطناعي؛ 
في وضعه الراهنء أن يقدم إسهاماء في المواقف التي يمكن أن تكون فيها القاعدة 
المعرفية أو الاستدلال» محدودين في جوهره*ماء أو يكون بإمكان المستفيد تعويض 
مظاهر القصور. ويمكن أيضا تطبيق الذكاء الاصطناعي في الظروف التي 
تستخدم فيها خوارزميات هذا الذكاء إلى جانب الأساليب الأخرى عءقم8) 
(1991 وروعتامل. 

والتطبيقات الخاصة بتنظيم المعلومات واسترجاعهاء المعتمدة على الذكاء 
الاصطناعي, وحده أو بالإضافة إلى الأساليب الأخرى في نموء إلا أن كل أمثال هذه 
التطبيقات تقريباء إما أن تكون ما تزال في مختبرات البحث. أو تكون قد اكتسبت فعلا 
الطابع التجاري» وتتاح مقابل رسوم. ومن ناحية أخرى» تم إدخال مختلف عناصر 
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الذكاء الاصطناعي في كثير من التطبيقات الخاصة بتنظيم المعلومات واسترجاعها. 
وقد تناول ولكس (2005) ١/1115‏ بالتفصيل» بعض تجارب تطبيقات الذكاء 
الاصطناعي في مجال تنظيم المعلومات واسترجاعهاء وذلك في سياق إلقاء نظرة 
فاحصة على العلاقة بين الذكاء الاصطناعي واسترجاع المعلومات. ففي أي اتجاه إذن 
يسير مجال تنظيم المعلومات واسترجاعهاء ونحن على مشارف العصر الرقمي؟ 
ويوحي البحث والتطوير في الذكاء الاصطناعي ببعض الاحتمالات على الأقل. 
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المؤلفة في سطور: 
هتنج تشو تتطن) 8صناء11 

ولدت في الصين» عام .١9651/‏ وحصلت على ليسانس في علم المكتبات, فى 
جامعة بكين» الصينء وعلى ماجستير المكتبات والمعلومات. فى جامعة ماجلء كنداء 
وعلى دكتوراه دراسات المعلومات» فى جامعة دركزلء. الولايات المتحدة الأمريكية. 
وقد عملت أستاذا مساعداء لمدة عام واحدء فى جامعة سانت جونزء الولايات المتحدة 
الأارتعع ماده بك اكير لز انا | ةنفد اد لحن الاك 
والمعلومات, فى جامعة لونج أيلاند» الولايات المتحدة الأمريكية. ومع تقدمهاني 
مسارها العلميء تغير توجهها الموضوعي من علم المكتبات بوجه عام, إلى استرجاع 
المعلومات على وجه الخصوص. وقد ألفت خمسة كتب بالصينية» حول استرجاع 
المعلومات» وما يتصل به من موضوعات» ى] أسهمت منذ عام ١991‏ بسبعة كتب 
بين التأليف والتحرير. وتشمل اهتتاماتها البحثية والتدريسية استخدام تقنيات 
المعلومات في المكتبات» ومناهج البحثء والاتصال العلمى. ولما أكثر من أربعين 
مقالة في موضوعات المكتبات الرقمية؛ والكتب والدوريات الإلكترونية؛ ومحركات 
البحث في العنكبوتية العالمية» وتطبيقات الجيل الثاني للعنكبوتية. وما أنضا نشاطها 
العلمي والمهني واسع المدىء على المستويات المحلية والوطنية والدولية. 
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المترجم فى سطور: 


أستاذ علم المعلومات المتفرغ فى كلية الآداب - جامعة القاهرة. ولد فى عزبة 
قاسمء مركز بسيون. محافظة الغربية» في .1447/7/١17‏ وقد تخرج في الوثائق 
وساف بمرية لكر ف فلن الأفات ت جابية القاهرة دور ير كر 44 
وحصل على الماجستيرٍ في التوثيق العلمى. فى الكلية نفسها عام ,141١‏ وحصل على 
الدكتوراه ف علم المعلومات» فى جامعة لندن عام 191/8. وقد تدرج في وظائف 
التدريس بكلية الآداب - جامعةالقاهزة. منذ عام .١19784‏ أعير خبيرا للمكتبات» فى 
امه اانا راك افر ال دي الدار الكتب الوطنية في أبو ظبي» ثم أستاذا 
لجامعة الإمام محمد بن سعود الإسلامية فى الرياض. وقد عمل خبيرا ومستشارا في 
المكتبات وتنظيم المعلومات» في عدد من المؤسسات المصرية والعربية والدولية» كم 
شارك في كثير من المؤتمرات الوطنية والدولية» ورأس تحرير مجلة '“دراسات عربية في 
المكتبات وعلم المعلومات'“. وله الكثير من الأعمال المنشورة» من الكتب المؤلفة: 
والكتب المترجمة» والبحوث والمقالات» ومراجعات الكتب. ويبدي في أعماله العلمية 
اهتهاما خاصا بأصول علم المعلومات؛ والاتصال العلمىء وإدارة مرافق المعلومات» 
وحدمات المعلومات,ء وتقنيات المعلومات في المكتبات؛ والقياسات الوراقية 
والمعلوماتية بوجه عام. وقد حصل على جائزة معهد المعلومات العلمية 151؛ على 
مجمل نشاطه العلمى» عام .7٠١1‏ 
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التصحيح اللغوى: محمد أبو العز 


الإشراف الفنى: حسن كامل 


أسريعة التغير. ويرصد الكعاب الوضع الراهن للمعرفة ف 

المعلومات واسترجاعهاء بجانبيه النظري والتطبيقي. ويد بنظرة 
* تاريخية موجزة: تربط الماضي بالحاضر ؛ لاستشراف آأفاق المستقبل؛ 
كما يتناو ل بأسلوب سلس بالغ الوضوح والإيجاز. خصائص المعلومات 
الرقمية» والأساليب والطرق والنظم والممارسات التي نشأت وتطورت 
في ظل الإنترنت. وفضلا عن اهتمامه بالجوانب التقنية: يبدي هذا 
الكتاب اهتماما واصحًا بالمستفيد من المعلومات؛, من حيث 
احتياجاته وأنماط وسبل تفاعله مع نظم استرجاع المعلومات بكل 
فئاتها. وبالإضافة إلى الشمول في معالجة قضايا المجالء يوثق الكتاب 
ارتباط القارئ برصيد الإنتاج الفكري الشري. من خلال منظومة 
الاستشهادات المرجعية الموزعة على الفصول الاثنى عشر. وكما 
يخاطب هذا الكتاب الدارسين والممارسين والباحثين في مجال تنظيم 
حرمت واحتريا0| لدم ا 
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